Ammo ishdan chiqish tezligini bashorat qilish bilan ishlashni qanday boshlash kerak? Qaysi ma'lumotlar kerak? Va amalga oshirish uchun qanday qadamlar bor?
Har qanday mashinani o'rganish vazifasida bo'lgani kabi, ma'lumotlar fanlari bo'yicha mutaxassislar ham ishlash uchun birinchi navbatda ma'lumotlarga muhtoj. Maqsadga qarab, tadqiqotchilar qanday ma'lumotlarni to'plashlari kerakligini aniqlaydilar. Keyinchalik, tanlangan ma'lumotlar tayyorlanadi, oldindan qayta ishlanadi va mashinani o'rganish modellarini yaratish uchun mos shaklda o'zgartiriladi.
Mashinalarni o'qitishning to'g'ri usullarini topish, modellarni nozik sozlash va eng yaxshi ijrochilarni tanlash ishning yana bir muhim qismidir. Eng yuqori aniqlik bilan bashorat qiladigan model tanlanganidan keyin uni ishlab chiqarishga kiritish mumkin.
Mijozlarning nobud bo'lishini bashorat qila oladigan ML-ga asoslangan tizimlarni yaratish bo'yicha olimlarning umumiy ish hajmi quyidagicha ko'rinishi mumkin:
Muammoni va yakuniy maqsadni tushunish
Ma'lumotlar yig'ish
Ma'lumotlarni tayyorlash va qayta ishlash
Modellashtirish va sinovdan o'tkazish
Modelni joylashtirish va monitoring qilish
Agar siz ushbu bosqichlar davomida nima sodir bo'lishini bilmoqchi bo'lsangiz, mashinani o'rganish loyihasi tuzilishi haqidagi maqolamizni o'qing . Endi keling, ushbu bosqichlarning har birini ishdan
chiqishni bashorat qilish kontekstida qanday yakunlashni bilib olaylik.
Tahlildan qanday tushunchalar olish kerakligini tushunish muhimdir. Muxtasar qilib aytganda, siz qanday savol berishni va natijada qanday turdagi mashinani o'rganish muammosini hal qilishni hal qilishingiz kerak: tasniflash yoki regressiya. Murakkab tuyuladi, lekin biz bilan sabr qiling.
Tasniflash. Tasniflashning maqsadi ma'lumotlar nuqtasi (bizning holatlarimizda mijoz) qaysi sinf yoki toifaga tegishli ekanligini aniqlashdir. Tasniflash muammolari uchun ma'lumotlar olimlari algoritmni o'rgatish uchun oldindan belgilangan maqsadli o'zgaruvchilar AKA yorliqlari (churner/churner bo'lmagan) - bashorat qilinishi kerak bo'lgan javoblar bilan tarixiy ma'lumotlardan foydalanadilar.
Tasniflash bilan korxonalar quyidagi savollarga javob berishi mumkin:
Bu mijoz ishdan chiqadimi yoki yo'qmi?
Mijoz obunani yangilaydimi?
Foydalanuvchi narxlash rejasini pasaytiradimi?
Mijozlarning noodatiy xatti-harakatlari belgilari bormi?
Atipik xulq-atvor belgilari haqidagi to'rtinchi savol anomaliyalarni aniqlash deb ataladigan tasniflash muammosining bir turini ifodalaydi . Anomaliyalarni aniqlash - bu ma'lumotlarning qolgan qismidan sezilarli darajada chetga chiqadigan ma'lumotlar nuqtalarini aniqlashdir.
Do'stlaringiz bilan baham: |