Hiyerarxik Klasterlash:
Bu algoritmalar ma'lumotlarni darajaga ko'ra guruhlarga ajratadi. Boshlanishi bo'lmagan qo'shish va uchramoq jarayonlari orqali guruhlar paydo bo'ladi va bu guruhlar boshqa guruhlar bilan birlashadi yoki farq qiladi. Natijada, daraja tizimi yaratiladi.
DBSCAN (Density-Based Spatial Clustering of Applications with Noise):
Uchun maxsus vaqti o'zida markazlardan tashqari bolalagan ma'lumotlarni topib oladi. Ma'lumotlarni shiddatini o'nglashtirish, eng kam kerakli guruhlarni aniqlash uchun ishlatiladi.
Mean Shift:
Ushbu algoritmada har bir ma'lumotning oldi olinayotgan markazning ko'rsatkichi orqali yangi markazni aniqlash uchun ko'p marta takrorlanadi. Natijada, har bir markaz yuqori shiddatga ega bo'lgan guruhni o'zlashtiradi.
Gaussian Mixture Model (GMM):
Bu, o'zgarishli modelni ishlatadigan probalistik klasterlash usuli. U ma'lumotlarni gaussov distributsiyalar to'plamlariga bo'lib ajratib oladi. Har bir guruh markazi, variatsiyasi va teginliklari mavjud bo'lgan gaussov distributsiyani ifodalaydi.
OPTICS (Ordering Points To Identify the Clustering Structure):
Bu, DBSCAN algoritmaga o'xshash, lekin u ma'lumotlarni qayta tartiblashda bo'lib, guruhlar paydo bo'ladi.
Agglomerative Hierarchical Clustering:
Bu klasterlash algoritmi esa qanday ma'lumotlar yig'ilishi va ularni qanday birlashtirishni aniqlash jarayonida guruhlarni yaratish uchun ishlatiladi.
Klasterlash algoritmlari, ma'lumotlar turlari, shakllar, o'zgarishlarni o'rganish maqsadlari va boshqa tuzatishlar boyicha tanlanishi kerak. Her bir algoritmning o'zining afzalliklari va chegaralari mavjud bo'lib, ba'zilari kerakli vaqtda va ma'lumotlar turlari uchun yaxshi natijalarni olishda eng yaxshi bo'ladi.
Do'stlaringiz bilan baham: |