Kirish turlari
Ob'ektlarning indikativ tavsifi. Har bir ob'ekt o'zining xususiyatlari deb ataladigan xususiyatlar to'plami bilan tavsiflanadi . Xususiyatlar raqamli yoki raqamli bo'lmagan bo'lishi mumkin.
Ob'ektlar orasidagi masofa matritsasi . Har bir ob'ekt metrik fazodagi barcha boshqa ob'ektlarga masofalar bilan tavsiflanadi .
Ob'ektlar orasidagi o'xshashlik matritsasi [8] . Ob'ektning metrik fazoda namunaning boshqa ob'ektlari bilan o'xshashlik darajasi hisobga olinadi. Bu erdagi o'xshashlik ob'ektlar orasidagi masofani (farqni) 1 ga to'ldiradi.
Zamonaviy ilm-fanda kiritilgan ma'lumotlarni qayta ishlash uchun bir nechta algoritmlardan foydalaniladi. Ob'ektlarni belgilari bo'yicha taqqoslash yo'li bilan tahlil qilish (biologiya fanlarida eng ko'p uchraydi) Q - tipidagi tahlil, ob'ektlarga asoslangan xususiyatlarni taqqoslashda esa - R - tipidagi tahlil deb ataladi. Gibrid tahlil turlaridan foydalanishga urinishlar mavjud (masalan, RQ tahlili ), ammo bu metodologiya hali to'g'ri ishlab chiqilmagan.
Klasterlashning maqsadlari
Klaster tuzilishini aniqlash orqali ma'lumotlarni tushunish . Namunani o'xshash ob'ektlar guruhlariga bo'lish har bir klaster uchun o'z tahlil usulini qo'llash orqali ma'lumotlarni keyingi qayta ishlash va qaror qabul qilishni soddalashtirish imkonini beradi (" bo'lin va zabt et " strategiyasi).
Ma'lumotlarni siqish . Agar dastlabki namuna haddan tashqari katta bo'lsa, unda har bir klasterdan eng tipik vakillardan birini qoldirib, uni qisqartirish mumkin.
Yangilikni aniqlash . _ _ Klasterlarning birortasiga biriktirib bo'lmaydigan atipik ob'ektlar tanlanadi.
Birinchi holda, ular klasterlar sonini kichikroq qilishga harakat qilishadi. Ikkinchi holda, har bir klaster ichidagi ob'ektlarning yuqori darajadagi o'xshashligini ta'minlash muhimroqdir va klasterlarning soni har qanday bo'lishi mumkin. Uchinchi holatda, klasterlarning birortasiga to'g'ri kelmaydigan alohida ob'ektlar eng katta qiziqish uyg'otadi.
Bu barcha hollarda ierarxik klasterlash qo'llanilishi mumkin , qachonki yirik klasterlar kichikroqlarga bo'lingan, ular esa, o'z navbatida, undan ham kichikroq bo'linadi va hokazo. Bunday vazifalar taksonomiya vazifalari deb ataladi . Taksonomiya natijasi daraxtga o'xshash ierarxik tuzilishdir. Bundan tashqari, har bir ob'ekt o'zi tegishli bo'lgan barcha klasterlarning ro'yxati bilan tavsiflanadi, odatda kattadan kichikgacha.
Do'stlaringiz bilan baham: |