Mashinali o’qitish asoslari. Nazoratli va nazoratsiz o’rganish


Download 74.55 Kb.
bet3/9
Sana02.06.2024
Hajmi74.55 Kb.
#1836472
1   2   3   4   5   6   7   8   9
Bog'liq
suniy intelekt shpagalka

Logistik Regressiya:Maqsad: Logistik regressiya modeli, ikki to'plamni (klassni) farqini aniqlashda ishlatiladi. Klassifikatsiya uchun mo'ljallangan bo'lib, natijalar 0 va 1 orasida joylashadi.Qanday ishlaydi: Model, ma'lumotlarni o'zgaruvchilarning liniyaviy birligiga (linearni o'zgaruvchi) bog'langanini qidiradi. Keyin esa olishilgan natijalarni [0, 1] oraliqda joylashtirish uchun logarifmik funksiya (sigmoid funksiya) ishlatiladi. P(Y=1)=1+e−(b0​+b1​x1​+b2​x2​+...+bnxn​)1​
Qarorlar daraxti va uni qurish algoritmlari.
Qarorlar daraxti (Decision Tree) va uni qurish algoritmalarining asosiy vazifalari, ma'lumotlar bo'yicha qaror qabul qilish va sinovlarni o'rganishdir. Bu algoritmlar barcha ta'lim ma'lumotlarini boshqarish, klassifikatsiya, regressiya va boshqa amaliyotlar uchun keng qo'llaniladi. Quyidagi, qarorlar daraxti va uni qurish algoritmlarini o'rganish uchun boshlang'ich tushunchalarni taqdim etaman:

Qarorlar Daraxti (Decision Tree):Qarorlar daraxti, ma'lumotlar bo'yicha har bir qaror qabul qilishda alohida bo'lib, jamlanishlari yordamida barcha ma'lumotlar o'rtasida eng yaxshi bo'lgan qarorni topishda yordam beradi. Har bir bog'lanish darajasidagi ma'lumotlar orasidagi ikki to'plam farqini mahalliy sinovlar orqali hisoblash uchun ishlatiladi.


Model: Qarorlar daraxtida har bir burchak (qo'shimcha bog'lanish) darajalar orqali bog'langan bo'lib, daraxtning boshida yuqori to'plam bilan aloqador bo'lgan ma'lumotlar joylashadi. O'rganilgan qarorlar va sinovlar har bir burchakda joylashadi.
Baholash: Baholanish, qarorlar daraxtining yorliq joylashishi va to'plamlar orasidagi ikki to'plam farqini qanday aniq aniqlashiga bog'liq bo'ladi. Bunday metrikalar qo'shimcha bog'lanish va gini indeksi kabi usullar orqali aniqlanadi.

Uni Qurish (Random Forest):


Random Forest, bir nechta qarorlar daraxtlarini (qarorlar daraxtlari to'plamini) ishlatadi. Har bir daraxt o'zining sinovlari va o'zining birinchiligi bo'yicha qaror qabul qilar. O'rta natija uchun, qarorlar daraxtlari o'rtasidagi majmualanish boshqa algoritmaga qarab aniqlanadi.
Model: Random Forestda har bir daraxt o'zining o'ziga xos sinovlari va burchaklari bilan ajratilgan bo'lib, umumiy daraxtlar orqali ko'rsatilgan natija yordamida boshqa sinovlarga ta'sir ko'rsatishga yordam beradi.
Baholash: Random Forest modellarni baholashda o'ziga xos usullar ishlatiladi. Masalan, o'rtacha qandaydar to'plam burchaklarning sinovlarini chiqarish (feature importance), majmualanish darajasining ko'rsatkichlari, va boshqa usullar.
Sinflash algoritmlari. K-eng yaqin qo’shni algoritmi.
K-eng yaqin qo’shni (k-nearest neighbors) algoritmi, ma'lumotlarni sinash va kategorizatsiya qilish uchun ishlatiluvchi o'zgaruvchanli modeldir. Bu algoritm ma'lumotlar o'rtasida keng ko'lamli ta'sir qiladi. K-eng yaqin qo’shni algoritmi tushunchalariga o'rinbosar yozamiz:

Download 74.55 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling