Raqamli texnologiyalarni rivojlantirish vazirligi muhammad al – xorazmiy nomidagi toshkent axborot texnologiyalari universiteti

bet	4/7
Sana	16.06.2023
Hajmi	0.97 Mb.
	#1492345

1 2 3 4 5 6 7

Bog'liq
Mansurov Sharof AI 1

5 . Naive Bayes klassifikatori
6. K-eng yaqin qoshnilar (KNN)

4. Qarorlar daraxtlari
Qarorlar daraxti algoritmlar va ma'lumotlar tuzilmalarida ko'pchilikka tanish
bo'lgan ikkilik daraxt sifatida ifodalanishi mumkin. Har bir tugun kirish

o'zgaruvchisini va ushbu o'zgaruvchining bo'linish nuqtasini ifodalaydi
(o'zgaruvchi raqam bo'lsa).
Barg tugunlari bashorat qilish uchun ishlatiladigan chiqish o'zgaruvchisidir.
Daraxtni barg tuguniga o'tkazish va shu tugundagi sinf qiymatini chiqarish orqali
bashorat qilinadi.
Daraxtlar tezda o'rganadilar va bashorat qiladilar. Bundan tashqari, ular keng
ko'lamli ilovalar uchun aniq va maxsus ma'lumotlarni tayyorlashni talab qilmaydi.
5 . Naive Bayes klassifikatori
Naive Bayes oddiy, ammo juda samarali algoritmdir.
Model ikki xil ehtimollikdan iborat bo'lib, ular o'quv ma'lumotlari yordamida
hisoblanadi:
1. Har bir sinfning ehtimoli.
2. X ning har bir qiymatida har bir sinf uchun shartli ehtimollik.
Ehtimoliy model hisoblab chiqilgandan so'ng, Bayes teoremasi yordamida
yangi ma'lumotlar bilan bashorat qilish uchun foydalanish mumkin. Agar sizda
haqiqiy ma'lumotlar mavjud bo'lsa, unda normal taqsimotni hisobga olsak, bu
ehtimolliklarni hisoblash unchalik qiyin emas.

Naive Bayes sodda deb ataladi, chunki algoritm har bir kirish o'zgaruvchisi
mustaqil deb hisoblaydi. Bu haqiqiy ma'lumotlarga mos kelmaydigan kuchli
taxmindir. Shunga qaramay, ushbu algoritm spamni tasniflash yoki qo'lda yozilgan
raqamlarni aniqlash kabi bir qator murakkab vazifalar uchun juda samarali.
6. K-eng yaqin qo'shnilar (KNN)
K-eng yaqin qo'shnilar - bu juda oddiy va juda samarali algoritm. KNN
modeli (K- eng yaqin qo'shnilar ) butun o'quv ma'lumotlar to'plami bilan
ifodalanadi. Juda oddiy, to'g'rimi?
Yangi nuqtani bashorat qilish ma'lumotlar to'plamidagi K eng yaqin
qo'shnilarni qidirish va ushbu K misollari uchun chiqish o'zgaruvchisini yig'ish
orqali amalga oshiriladi.
Bitta savol - ma'lumotlar misollari o'rtasidagi o'xshashlikni qanday aniqlash
mumkin. Agar barcha xususiyatlar bir xil shkalada bo'lsa (masalan, santimetr), u
holda eng oson yo'li Evklid masofasidan foydalanishdir, bu raqamni har bir kirish
o'zgaruvchisi bilan farqlar asosida hisoblash mumkin.
KNN barcha ma'lumotlarni saqlash uchun juda ko'p xotira talab qilishi
mumkin, ammo u tezda bashorat qiladi. Vaqt o'tishi bilan bashoratlarni to'g'ri
saqlash uchun trening ma'lumotlari ham yangilanishi mumkin.
Eng yaqin qo'shnilar g'oyasi ko'p o'lchovli ma'lumotlar (ko'p kirish
o'zgaruvchilari) bilan yaxshi ishlamasligi mumkin, bu muammoni hal qilishda
algoritm samaradorligiga salbiy ta'sir qiladi. Bu o'lchovlilikning la'nati deb ataladi.
Boshqacha qilib aytganda, siz faqat eng muhim bashoratli o'zgaruvchilardan
foydalanishingiz kerak.

Download 0.97 Mb.

Do'stlaringiz bilan baham:

1 2 3 4 5 6 7