Aglomerativ ierarxik klasterlash
Aglomerativ ierarxik klasterlash algoritmi IKA ning mashhur namunasidir. Ma'lumotlar to'plamini klasterlarga guruhlash uchun u pastdan yuqoriga yondashuvga amal qiladi . Bu shuni anglatadiki, ushbu algoritm har bir ma'lumotlar to'plamini boshida bitta klaster sifatida ko'rib chiqadi va keyin eng yaqin klaster juftligini birlashtirishni boshlaydi. U buni barcha klasterlar barcha ma'lumotlar to'plamini o'z ichiga olgan yagona klasterga birlashtirilmaguncha bajaradi.
Klasterlarning bu ierarxiyasi dendrogramma shaklida ifodalanadi.
Aglomerativ ierarxik klasterlash qanday ishlaydi?
AIK algoritmining ishlashini quyidagi bosqichlar yordamida tushuntirish mumkin:
1-qadam: Har bir ma'lumot nuqtasini bitta klaster sifatida yaratamiz. Aytaylik, N ma'lumot nuqtasi bor, shuning uchun klasterlar soni ham N bo'ladi.
2-qadam: Ikkita eng yaqin ma'lumot nuqtasini yoki klasterni oling va ularni bitta klaster hosil qilish uchun birlashtiring. Shunday qilib, endi N-1 klasterlari bo'ladi.
3-qadam : Yana ikkita eng yaqin klasterni oling va bitta klaster hosil qilish uchun ularni birlashtiramiz. N-2 klasterlari bo'ladi.
4- qadam: 3-bosqichni faqat bitta klaster qolguncha takrorlang. Shunday qilib, biz quyidagi klasterlarni olamiz. Quyidagi rasmlarni ko'rib chiqamiz:
5-qadam: Barcha klasterlar bitta katta klasterga birlashtirilgandan so'ng, muammo bo'yicha klasterlarni ajratish uchun dendrogrammani ishlab chiqamiz.
Ikki klaster orasidagi masofani o'lchash.
Ko'rib turganimizdek, ierarxik klasterlar uchun ikkita klaster orasidagi eng yaqin masofa juda muhimdir. Ikki klaster orasidagi masofani hisoblashning turli usullari mavjud va bu usullar klasterlash qoidasini belgilaydi. Ushbu choralar bog'lanish usullari deb ataladi . Quyida ba'zi mashhur ulanish usullari keltirilgan:
Do'stlaringiz bilan baham: |