Mashinani o'rganish nima? Mashinani o'qitish usullari, turlari, vazifalari va misollar
Download 1.03 Mb.
|
Mashinani o\'rganish nima Mashinani o\'qitish usullari, turlari,
- Bu sahifa navigatsiya:
- Naive Bayesian tasnifi
- K-yaqin qoshnilar (KNN)
Qaror daraxtlari
Qaror daraxti algoritmlar va ma'lumotlar tuzilmalaridan ko'pchilikka tanish bo'lgan ikkilik daraxt sifatida taqdim etilishi mumkin. Har bir tugun kirish o'zgaruvchisini va bu o'zgaruvchi uchun bo'linadigan nuqtani bildiradi (o'zgaruvchini son deb faraz qilsak). Barg tugunlari bashorat qilish uchun foydalaniladigan chiqish o'zgaruvchisidir. Oldindan bashorat qilish daraxtni barg tuguniga o'tkazish va shu tugunning klass qiymatini bosib chiqarish orqali amalga oshiriladi. Daraxtlar tezda o'rganadilar va bashorat qilishadi. Bundan tashqari, ular keng ko'lamli vazifalar uchun aniqdir va maxsus ma'lumotlarni tayyorlashni talab qilmaydi. Naive Bayesian tasnifi Naive Bayes oddiy, ammo hayratlanarli darajada kuchli algoritmdir. Model ikkita ma'lumotdan iborat bo'lib, ular o'quv ma'lumotlari asosida hisoblanadi: Har bir sinfga kirish ehtimoli. X ning har bir qiymati uchun har bir sinf uchun shartli ehtimollik. Ehtimollar modelini hisoblab chiqqandan so'ng, Bayes teoremasi yordamida yangi ma'lumotlar bilan bashorat qilish uchun foydalanish mumkin. Agar sizda haqiqiy ma'lumotlar bo'lsa, normal taqsimotni olsak, bu ehtimolliklarni hisoblash juda qiyin emas. Naive Bayes sodda deb ataladi, chunki algoritm har bir kirish o'zgaruvchisi mustaqil deb taxmin qiladi. Bu kuchli taxmin va haqiqiy ma'lumotlarga mos kelmaydi. Shunga qaramay, ushbu algoritm spamni tasniflash yoki qo'lda yozilgan raqamlarni tanib olish kabi bir qator murakkab vazifalar uchun juda samarali. K-yaqin qo'shnilar (KNN) K-yaqin qo'shnilar juda oddiy va juda samarali algoritm. KNN (K yaqin atrofdagi qo'shnilar) modeli butun o'quv ma'lumotlari bazasida taqdim etilgan. Juda oddiy, shunday emasmi? Yangi nuqtani bashorat qilish ma'lumotlar bazasida K yaqin atrofdagi qo'shnilarni qidirish va ushbu K misollar uchun chiqish o'zgaruvchisini yig'ish orqali amalga oshiriladi. Bitta savol - ma'lumotlar nusxalari o'rtasidagi o'xshashlikni qanday aniqlash mumkin. Agar barcha xususiyatlar bir xil miqyosda bo'lsa (masalan, santimetr), unda Evklid masofasini ishlatish eng oson yo'li - har bir kirish o'zgaruvchisining farqiga qarab hisoblanishi mumkin bo'lgan raqam. KNN barcha ma'lumotlarni saqlash uchun ko'p xotirani talab qilishi mumkin, ammo bu tezda bashorat qiladi. Shuningdek, vaqt o'tishi bilan bashoratlarni aniq saqlash uchun mashg'ulot ma'lumotlarini yangilash mumkin. Yaqin qo'shnilarning fikri ko'p o'lchovli ma'lumotlar bilan yaxshi ishlamasligi mumkin (ko'p kirish parametrlari), bu muammoni hal qilishda algoritm samaradorligiga salbiy ta'sir qiladi. Bunga o'lchov la'nati deyiladi. Boshqacha qilib aytganda, faqat eng muhim bashoratli o'zgaruvchilardan foydalanishga arziydi. Download 1.03 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling