Mavzu : Nazoratsiz o’qitish modellari. Gaussian mixture


Download 1.18 Mb.
Sana28.12.2022
Hajmi1.18 Mb.
#1070474
Bog'liq
3-TOPSHIRIQ

Mavzu : Nazoratsiz o’qitish modellari. Gaussian mixture


Reja:

  1. Nazoratsiz o’qitish modellari

  2. Umumiy koʻrinish

  3. Gaussian mixture



Nazoratsiz o’qitish modellari
Nazoratsiz o'qitishning eng mashhur usullaridan biri bu klasterlashdir. Bu biz odatda mashinani o'rganish bo'yicha sayohatimiz boshida o'rganadigan tushunchadir va uni tushunish uchun juda oddiy. Ishonchim komilki, siz mijozlarni segmentatsiyalash, bozor savatini tahlil qilish va h.k. kabi loyihalarga duch kelgansiz yoki ular ustida ishlagansiz.
Biz mashinani nazoratli o’qitishni o'rgandik, unda modellar o'quv ma'lumotlari nazorati ostida etiketli ma'lumotlardan foydalangan holda o'qitiladi. Ammo bizda yorliqli ma'lumotlar bo'lmagan va berilgan ma'lumotlar to'plamidan yashirin naqshlarni topish kerak bo'lgan ko'p holatlar bo'lishi mumkin. Shunday qilib, mashinani o’qitishda bunday holatlarni hal qilish uchun bizga nazoratsiz o’qitish usullari kerak. Nomidan ko'rinib turibdiki, nazoratsiz o’qitish - bu mashinani o’qitish usuli bo'lib, unda modellar o'quv ma'lumotlar to'plami yordamida nazorat qilinmaydi. Buning o'rniga, modellarning o'zi berilgan ma'lumotlardan yashirin naqsh va tushunchalarni topadi. Uni yangi narsalarni o'rganish paytida inson miyasida sodir bo'ladigan o'rganish bilan solishtirish mumkin. Buni quyidagicha aniqlash mumkin: Nazoratsiz o’qitishni regressiya yoki tasniflash muammosiga to‘g‘ridan-to‘g‘ri qo‘llash mumkin emas, chunki nazoratli o’qitishdan farqli o‘laroq, bizda kirish ma’lumotlari mavjud, lekin tegishli chiqish ma’lumotlari yo‘q.
Umumiy koʻrinish Gauss aralashmasi modellari kuchli klasterlash algoritmidir
Gauss aralashmasi modellari qanday ishlashini va ularni Pythonda qanday amalga oshirishni tushuningShuningdek, biz k-vositalari klasterlash algoritmini ko'rib chiqamiz va Gauss aralashmasi modellari uni qanday yaxshilashini ko'rib chiqamiz.

Umumiy koʻrinish
O'quv muammolari ustida ishlash juda yoqadi. Ular nazorat ostidagi o'quv muammosiga mutlaqo boshqacha muammo taklif qiladilar - menda mavjud bo'lgan ma'lumotlar bilan tajriba o'tkazish uchun ko'proq joy bor. Mashinani o'rganish sohasidagi ishlanmalar va yutuqlarning aksariyati nazoratsiz ta'lim sohasida sodir bo'lishi ajablanarli emas.
A
Ammo bu erda bir narsa bor - klasterlash juda ko'p qatlamlarga ega. Bu biz ilgari o'rgangan asosiy algoritmlar bilan cheklanib qolmaydi. Bu biz haqiqiy dunyoda xatosiz aniqlik bilan foydalanishimiz mumkin bo'lgan kuchli nazoratsiz o'rganish usuli.
Gaussian mixture
Gauss aralashmasi modellari - bu klasterlash algoritmlaridan biri bo'lib, men ushbu maqolada gaplashmoqchiman. Sevimli mahsulotingiz sotuvini bashorat qilishni xohlaysizmi? Yoki, ehtimol siz mijozlarning turli guruhlari ob'ektivi orqali mijozlarning noroziligini tushunishni xohlaysiz. Qanday bo'lmasin, siz Gauss aralashmasi modellarini juda foydali deb topasiz.
Gauss aralashmasi modellari (GMM) ma'lum miqdordagi Gauss taqsimoti mavjudligini taxmin qiladi va bu taqsimotlarning har biri klasterni ifodalaydi. Shunday qilib, Gauss aralashmasi modeli bitta taqsimotga tegishli ma'lumotlar nuqtalarini birgalikda guruhlashga intiladi.
Gauss aralashmasi modellari ehtimollik modellari bo'lib, nuqtalarni turli klasterlarda taqsimlash uchun yumshoq klasterlash usulidan foydalanadi. Men tushunishni osonlashtiradigan yana bir misol keltiraman.
Bu erda uchta klaster mavjud bo'lib, ular uchta rang bilan belgilanadi - Moviy, Yashil va Moviy. Keling, qizil rang bilan belgilangan ma'lumotlar nuqtasini olaylik. Ushbu nuqtaning ko'k klasterning bir qismi bo'lish ehtimoli 1 ga, yashil yoki ko'k rangli klasterlarning bir qismi bo'lish ehtimoli esa 0 ga teng.

Gauss aralashmasi modellari Gauss taqsimotlariga ma'lumotlar nuqtalarini belgilash uchun yumshoq klasterlash texnikasidan foydalanadi. Ishonchim komilki, siz ushbu taqsimotlar nima ekanligini qiziqtirgandirsiz, shuning uchun keyingi bo'limda buni tushuntirib beraman.
Gauss taqsimoti
Ishonchim komilki, siz Gauss taqsimoti (yoki Oddiy taqsimot) bilan tanishsiz. U qo'ng'iroq shaklidagi egri chiziqqa ega, ma'lumotlar nuqtalari o'rtacha qiymat atrofida nosimmetrik taqsimlangan.
Quyidagi rasmda o'rtacha (m) va dispersiya (s 2 ) farqlari bilan bir nechta Gauss taqsimoti mavjud . Esda tutingki, s qiymati qanchalik baland bo'lsa, tarqalish ko'proq bo'ladi:

Bir o'lchovli fazoda Gauss taqsimotining ehtimollik zichligi funktsiyasi quyidagicha ifodalanadi:

bu yerda m - o'rtacha, s 2 - dispersiya.
Ammo bu faqat bitta o'zgaruvchi uchun to'g'ri bo'ladi. Ikki o'zgaruvchi bo'lsa, 2D qo'ng'iroq shaklidagi egri o'rniga biz quyida ko'rsatilgandek 3D qo'ng'iroq egri chizig'iga ega bo'lamiz:

Ehtimollik zichligi funksiyasi quyidagicha ifodalanadi:

bu yerda x - kirish vektori, m - 2D o'rtacha vektor, S - 2×2 kovariatsiya matritsasi. Kovariatsiya endi bu egri chiziqning shaklini belgilaydi. Xuddi shu narsani d o'lchovlari uchun umumlashtirishimiz mumkin.


Shunday qilib, bu ko'p o'zgaruvchan Gauss modeli d uzunlikdagi vektorlar sifatida x va m ga ega bo'ladi va S dxd kovariatsiya matritsasi bo'ladi.
Demak, d xususiyatli ma'lumotlar to'plami uchun biz k Gauss taqsimotining aralashmasiga ega bo'lamiz (bu erda k klasterlar soniga ekvivalent), ularning har biri ma'lum o'rtacha vektor va dispersiya matritsasiga ega. Ammo kuting - har bir Gauss uchun o'rtacha va dispersiya qiymati qanday tayinlangan?
Bu qiymatlar Expectation-Maximization (EM) deb nomlangan usul yordamida aniqlanadi. Gauss aralashmasi modellarining ishlashiga chuqurroq kirishdan oldin biz ushbu texnikani tushunishimiz kerak.
Download 1.18 Mb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling