Mirzo ulugʻbek nomidagi oʻzbekiston milliy universitetining jizzax filiali


Download 90.25 Kb.
bet7/11
Sana18.06.2023
Hajmi90.25 Kb.
#1591632
1   2   3   4   5   6   7   8   9   10   11
Bog'liq
Mustaqil ish 1 Nodirbek (2)

Keyin uchta holat mumkin:
S to'plamining misollari bir xil Ci yorlig'iga ega, shuning uchun barcha o'quv misollari bir xil sinfga tegishli. Bunday holda, o'rganish mantiqiy emas, chunki modeldagi barcha misollar modelni tanib olishni "o'rganadigan" bitta sinf bo'ladi. Daraxtning o'zi Ci sinfi bilan bog'liq bo'lgan bitta katta bargga o'xshaydi. Keyin uni ishlatish mantiqiy bo'lmaydi, chunki barcha yangi ob'ektlar bir xil sinfga tegishli bo'ladi.
S to'plami-bu misollarsiz bo'sh to'plam. Uning uchun varaq hosil bo'ladi, uning sinfi boshqa to'plamdan chiqadi. Masalan, ota-onalar to'plamining eng keng tarqalgani sinf.
S to'plami barcha Ck sinflarining o'quv misollaridan iborat. Bunday holda, to'plam sinflarga muvofiq kichik to'plamlarga bo'linadi. Buning uchun S to'plamining Aj atributlaridan birini tanlang, u ikki yoki undan ortiq noyob qiymatlardan iborat: a1, a2, ..., ap), bu erda p — belgining noyob qiymatlari soni. S to'plami tegishli atribut qiymatiga ega misollardan tashkil topgan p kichik to'plamlariga (S1, S2, ..., Sp) bo'linadi. Bo'linish jarayoni davom etmoqda, ammo quyidagi atribut bilan. Natijada paydo bo'lgan barcha misollar bir xil sinfga aylanmaguncha takrorlanadi.
Uchinchisi, qaror daraxtlarini qurish uchun ishlatiladigan ko'pgina algoritmlarda qo'llaniladi. Ushbu usul daraxtni yuqoridan pastgacha, ya'ni ildiz tugunidan barglarga hosil qiladi.
Bugungi kunda ko'plab o'quv algoritmlari mavjud: ID3, CART, C4.5, C5.0, NewId, ITrule, CHAID, CN2 va boshqalar. Eng mashhurlari:
ID3 (Iterative Dichotomizer 3). Algoritm faqat diskret maqsadli o'zgaruvchi bilan ishlashga imkon beradi. ID3 asosida qurilgan qaror daraxtlari malakaga ega. Tugundagi avlodlar soni cheksizdir. Algoritm etishmayotgan ma'lumotlar bilan ishlamaydi.
C4.5. Yo'qolgan atribut qiymatlari bilan ishlash qobiliyati bilan to'ldirilgan ID3-ning" rivojlangan " versiyasi. 2008 yilda Spring Science nashri tadqiqot o'tkazdi va C4.5 eng mashhur Data Mining algoritmi ekanligini aniqladi.

Download 90.25 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   11




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling