Mashinani o'rganishdan foydalangan holda Mijozning xulq-atvori va demografik ma'lumotlari asosida kompaniyani tark etishi (ketishi) ehtimolini bashorat qilish


Modellashtirish va sinovdan o'tkazish


Download 1.02 Mb.
bet9/12
Sana18.06.2023
Hajmi1.02 Mb.
#1586560
1   ...   4   5   6   7   8   9   10   11   12
Bog'liq
max ball

Modellashtirish va sinovdan o'tkazish


Loyihaning ushbu bosqichining asosiy maqsadi - charchoqni bashorat qilish modelini ishlab chiqish. Mutaxassislar odatda ko'plab modellarni o'rgatishadi, sozlashadi, baholaydilar va o'quv ma'lumotlari bo'yicha kerakli darajadagi aniqlik darajasida potentsial charxchilarni aniqlaydigan modelni aniqlash uchun sinovdan o'tkazadilar.
Klassik mashinani o'rganish modellari odatda mijozlarning yo'qolishini bashorat qilish uchun ishlatiladi, masalan, logistik regressiya, qaror daraxtlari, tasodifiy o'rmon va boshqalar. ScienceSoft kompaniyasidan Aleks Bekker Random Forest-dan asosiy model sifatida foydalanishni taklif qiladi,
keyin "XGBoost, LightGBM yoki CatBoost kabi modellarning ishlashini baholash mumkin". Ma'lumotlar bo'yicha olimlar, odatda, murakkabroq algoritmlarni bashorat qilish to'g'riligini solishtirish uchun metrik sifatida asosiy modelning ishlashidan foydalanadilar.
Logistik regressiya ikkilik tasniflash muammolari uchun ishlatiladigan algoritmdir. U bog'liq o'zgaruvchi va bir yoki bir nechta mustaqil o'zgaruvchilar (xususiyatlar) o'rtasidagi munosabatni o'lchash orqali hodisaning ehtimolini bashorat qiladi. Aniqroq aytganda, logistik regressiya standart toifaga tegishli bo'lgan misol (ma'lumotlar nuqtasi) ehtimolini bashorat qiladi.
Qarorlar daraxti - bu nazorat ostidagi o'rganish algoritmining bir turi (oldindan belgilangan maqsadli o'zgaruvchiga ega). Ko'pincha tasniflash vazifalarida qo'llanilsa-da, u raqamli ma'lumotlar bilan ham
ishlay oladi. Ushbu algoritm ma'lumotlar namunasini bashorat qilish uchun kirisho'zgaruvchilaridagi eng muhim farqlovchiga asoslangan ikki yoki undan ortiq bir hil to'plamlarga ajratadi. Har bir bo'linish bilan daraxtning bir qismi hosil bo'ladi. Natijada, qaror tugunlari va barg tugunlari (bu qarorlar yoki
tasniflar) bo'lgan daraxt ishlab chiqiladi. Daraxt ildiz tugunidan boshlanadi - eng yaxshi bashoratchi.

Qarorlar daraxtining asosiy tuzilishi. Manba: Python mashinasini o'rganish bo'yicha qo'llanma


Qaror daraxtlarining bashorat natijalari osongina talqin qilinishi va ko'rinishi mumkin. Hatto tahliliy yoki ma'lumot faniga ega bo'lmagan odamlar ham ma'lum bir natija qanday paydo bo'lganini
tushunishlari mumkin. Boshqa algoritmlar bilan solishtirganda, qaror daraxtlari kamroq ma'lumotlarni tayyorlashni talab qiladi, bu ham afzallik hisoblanadi. Biroq, agar ma'lumotlarga kichik o'zgarishlar
kiritilgan bo'lsa, ular beqaror bo'lishi mumkin. Boshqacha qilib aytadigan bo'lsak, ma'lumotlarning o'zgarishi tubdan farq qiladigan daraxtlarning paydo bo'lishiga olib kelishi mumkin. Ushbu muammoni hal qilish uchun ma'lumotlar olimlari guruhda (AKA ansambli) qarorlar daraxtlaridan foydalanadilar, biz bu haqda keyin gaplashamiz.

Download 1.02 Mb.

Do'stlaringiz bilan baham:
1   ...   4   5   6   7   8   9   10   11   12




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling