Raqamli texnologiyalarni rivojlantirish vazirligi muhammad al – xorazmiy nomidagi toshkent axborot texnologiyalari universiteti


Download 0.97 Mb.
Pdf ko'rish
bet4/7
Sana16.06.2023
Hajmi0.97 Mb.
#1492345
1   2   3   4   5   6   7
Bog'liq
Mansurov Sharof AI 1

4. Qarorlar daraxtlari 
Qarorlar daraxti algoritmlar va ma'lumotlar tuzilmalarida ko'pchilikka tanish 
bo'lgan ikkilik daraxt sifatida ifodalanishi mumkin. Har bir tugun kirish 


o'zgaruvchisini va ushbu o'zgaruvchining bo'linish nuqtasini ifodalaydi 
(o'zgaruvchi raqam bo'lsa). 
Barg tugunlari bashorat qilish uchun ishlatiladigan chiqish o'zgaruvchisidir. 
Daraxtni barg tuguniga o'tkazish va shu tugundagi sinf qiymatini chiqarish orqali 
bashorat qilinadi. 
Daraxtlar tezda o'rganadilar va bashorat qiladilar. Bundan tashqari, ular keng 
ko'lamli ilovalar uchun aniq va maxsus ma'lumotlarni tayyorlashni talab qilmaydi. 
5 . Naive Bayes klassifikatori 
Naive Bayes oddiy, ammo juda samarali algoritmdir. 
Model ikki xil ehtimollikdan iborat bo'lib, ular o'quv ma'lumotlari yordamida 
hisoblanadi: 
1. Har bir sinfning ehtimoli. 
2. X ning har bir qiymatida har bir sinf uchun shartli ehtimollik. 
Ehtimoliy model hisoblab chiqilgandan so'ng, Bayes teoremasi yordamida 
yangi ma'lumotlar bilan bashorat qilish uchun foydalanish mumkin. Agar sizda 
haqiqiy ma'lumotlar mavjud bo'lsa, unda normal taqsimotni hisobga olsak, bu 
ehtimolliklarni hisoblash unchalik qiyin emas. 


Naive Bayes sodda deb ataladi, chunki algoritm har bir kirish o'zgaruvchisi 
mustaqil deb hisoblaydi. Bu haqiqiy ma'lumotlarga mos kelmaydigan kuchli 
taxmindir. Shunga qaramay, ushbu algoritm spamni tasniflash yoki qo'lda yozilgan 
raqamlarni aniqlash kabi bir qator murakkab vazifalar uchun juda samarali. 
6. K-eng yaqin qo'shnilar (KNN) 
K-eng yaqin qo'shnilar - bu juda oddiy va juda samarali algoritm. KNN 
modeli (K- eng yaqin qo'shnilar ) butun o'quv ma'lumotlar to'plami bilan 
ifodalanadi. Juda oddiy, to'g'rimi? 
Yangi nuqtani bashorat qilish ma'lumotlar to'plamidagi K eng yaqin 
qo'shnilarni qidirish va ushbu K misollari uchun chiqish o'zgaruvchisini yig'ish 
orqali amalga oshiriladi. 
Bitta savol - ma'lumotlar misollari o'rtasidagi o'xshashlikni qanday aniqlash 
mumkin. Agar barcha xususiyatlar bir xil shkalada bo'lsa (masalan, santimetr), u 
holda eng oson yo'li Evklid masofasidan foydalanishdir, bu raqamni har bir kirish 
o'zgaruvchisi bilan farqlar asosida hisoblash mumkin. 
KNN barcha ma'lumotlarni saqlash uchun juda ko'p xotira talab qilishi 
mumkin, ammo u tezda bashorat qiladi. Vaqt o'tishi bilan bashoratlarni to'g'ri 
saqlash uchun trening ma'lumotlari ham yangilanishi mumkin. 
Eng yaqin qo'shnilar g'oyasi ko'p o'lchovli ma'lumotlar (ko'p kirish 
o'zgaruvchilari) bilan yaxshi ishlamasligi mumkin, bu muammoni hal qilishda 
algoritm samaradorligiga salbiy ta'sir qiladi. Bu o'lchovlilikning la'nati deb ataladi. 
Boshqacha qilib aytganda, siz faqat eng muhim bashoratli o'zgaruvchilardan 
foydalanishingiz kerak. 

Download 0.97 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling