Klasterlashtirish haqida


Klasterlash muammolarining tipologiyasi


Download 0.78 Mb.
bet3/14
Sana21.06.2023
Hajmi0.78 Mb.
#1637820
1   2   3   4   5   6   7   8   9   ...   14
Bog'liq
KOMPTARMOQKURSISH

Klasterlash muammolarining tipologiyasi
Kirish turlari
Ob'ektlarning indikativ tavsifi. Har bir ob'ekt o'ziga xos xususiyatlar deb ataladigan xususiyatlar to'plami bilan tavsiflanadi. Xususiyatlar ham raqamli, ham toifali bo'lishi mumkin;
Ob'ektlar orasidagi masofa matritsasi. Har bir ob'ekt o'quv majmuasidan barcha ob'ektlargacha bo'lgan masofa bilan tavsiflanadi.
Ob'ektlarning atribut tavsifidan masofa matritsasini hisoblash ob'ektlar orasidagi metrikaning ta'rifiga qarab cheksiz ko'p usullarda amalga oshirilishi mumkin. Ko'rsatkichni tanlash o'quv namunasi va vazifaga bog'liq.
Klasterlashning maqsadlari
Ob'ektlarning tasnifi.
- Klaster tuzilishini aniqlash orqali ob'ektlar orasidagi bog'liqlikni tushunishga urinish. Namunani o'xshash ob'ektlar guruhlariga bo'lish keyingi ma'lumotlarni qayta ishlash va qaror qabul qilishni soddalashtiradi, har bir klasterga o'z tahlil usulini qo'llash imkonini beradi ("bo'l va zabt et" strategiyasi). Bunday holda, ular eng keng tarqalgan naqshlarni aniqlash uchun klasterlar sonini kamaytirishga intiladi;
-Ma'lumotlarni siqish. Har bir klasterning eng tipik a'zolaridan bir yoki bir nechtasini olish orqali dastlabki namuna hajmini kamaytirish mumkin. Bu erda har bir klasterning chegaralarini eng aniq belgilash muhimdir, ularning soni muhim mezon emas;
-Yangilikni aniqlash (shovqinni aniqlash). Har qanday klasterdagi mezonlarga mos kelmaydigan ob'ektlarni tanlash. Aniqlangan ob'ektlar alohida qayta ishlanadi.
Klasterlash usullari:
-Grafik klasterlash algoritmlari. Algoritmlarning eng ibtidoiy sinfi. Hozirgi vaqtda u amalda amalda qo'llanilmaydi;
-Ehtimoliy klasterlash algoritmlari. O'quv namunasidagi har bir ob'ekt ma'lum bir ehtimollik darajasi bilan klasterlarning har biriga tegishli:EM algoritmi;
-Ierarxik klasterlash algoritmlari. Ichki klasterlar ierarxiyasini yaratish orqali ma'lumotlarni tartibga solish;
-Algoritm k-medium. Klaster nuqtalarining ushbu klasterlarning markazlaridan umumiy kvadrat og'ishini minimallashtirishga asoslangan iterativ algoritm;
-Yaqinlikning tarqalishi. Har bir klasterning tipik a'zolarini tanlash uchun juftlik ob'ektlari o'rtasida o'xshashlik xabarlarini tarqatadi;
-O'rtacha siljish. Eng yuqori zichlikka ega bo'lgan hududlarda klaster markazlarini tanlaydi;
-Spektral klasterlash (inglizcha spektral klasterlash). Boshqa klasterlash usullarini qo'llashdan oldin o'lchamlarni kamaytirish uchun masofaviy matritsaning o'ziga xos qiymatlaridan foydalanadi;
-Shovqinli ilovalarni zichlikka asoslangan fazoviy klasterlash (DBSCAN). Algoritm guruhlari yuqori zichlikdagi hududni bitta klasterga ajratadi. Yagona joylashgan nuqtalar shovqin sifatida belgilanadi.

Download 0.78 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   14




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling