7-Amaliy mashg‘ulot
Download 470.85 Kb. Pdf ko'rish
|
Timsollarni tanib olish 7-12 Amaliy mashgulot.docx
12-Amaliy mashg‘ulot
Mavzu : Siluetni baholash orqali klasterlash sifatini baholash Siluet baholash (Silhouette analysis) klasterlashning sifatini baholash uchun bir usul hisoblanadi. Ushbu usul orqali klasterlashning qanday to'g'ri amalga oshirilganligini, obyektlarining klasteriga qanday yaxshi moslashganligini bilib olish mumkin. Siluet baholashning asosiy qadamlari quyidagilardan iborat: 1. Har bir obyektning siluet koeffitsiyenti (silhouette coefficient) hisoblanadi. Siluet koeffitsiyenti, obyektning o'zining klasterida qanday yaxshi joylashtirilganligini ifodalaydi. Siluet koeffitsiyenti -1 va +1 oralig'ida bo'lishi mumkin. 2. Siluet koeffitsiyentini hisoblash uchun quyidagi formuladan foydalaniladi: Siluet_koeffitsiyenti(i) = (b(i) - a(i)) / max(a(i), b(i)) Bu yerda, a(i) - obyekt i ning o'zining klasteriga yaqinlik o'rtalamasi (mean distance to the other points in the same cluster), b(i) - obyekt i ning eng yaqin bo'lmagan klasteriga yaqinlik o'rtalamasi (mean distance to the points in the nearest neighboring cluster). 3. Har bir obyektning siluet koeffitsiyenti hisoblandikdan so'ng, o'rtacha siluet koeffitsiyenti klasterlar o'rtasida hisoblanadi. Bu o'rtacha siluet koeffitsiyenti klasterlashning umumiy sifatini ifodalaydi. Siluet baholash natijalari quyidagi tarjimaga ega bo'lishi mumkin: • Agar o'rtacha siluet koeffitsiyenti +1 ga yaqin bo'lsa, bu ko'rsatkich klasterlashning yaxshi natijasini ifodalaydi. • Agar o'rtacha siluet koeffitsiyenti -1 ga yaqin bo'lsa, bu ko'rsatkich klasterlashning yomon natijasini ifodalaydi. • Agar o'rtacha siluet koeffitsiyenti nolga yaqin bo'lsa, bu ko'rsatkich klasterlashning samarali yoki samarasizligini ifodalaydi. Siluet baholash klasterlash algoritmlarini taqqoslash, klasterlar sonini va klasterlash parametrlarini tanlashda yordam beradi. Ushbu usulning maqsadi klasterlashning sifatini objektiv baholash orqali yaxshilashdirish va to'g'ri parametrlarni tanlashda yordam berishdir. Bundan tashqari, siluet baholashni amalga oshirish uchun Python dasturlash tilida turli kutubxonalardan foydalanishingiz mumkin, masalan, scikit-learn kutubxonasi klasterlash algoritmlari bilan birga siluet baholashni ham o'z ichiga olgan. Bu kutubxona klasterlash natijalariga asosan siluet baholashni hisoblaydi. Siluet baholashning asosiy qadamlari quyidagilardan iborat: 1. Klasterlash: Obyektlarni klasterlarga bo'lish. Bu klasterlash jarayoni bir klasterlash algoritmi (masalan, K-means) yordamida amalga oshiriladi. Klasterlashning asosiy maqsadi obyektlarni o'zining o'ziga yaqin obyektlar bilan guruhi (klaster)ga joylashtirishdir. 2. Obyektning o'zining klasteriga yaqinlik o'rtalamasini (mean distance to the other points in the same cluster) hisoblash: Bu qadamda har bir obyektning o'zining klasteridagi barcha boshqa obyektlarga bo'lgan masofasi (uzluksizlik) hisoblanadi. Uzluksizliklar o'rtasini topish uchun obyektlarning klasteriga yaqinlik o'rtalamasi hisoblanadi. 3. Obyektning eng yaqin bo'lmagan klasteriga yaqinlik o'rtalamasini (mean distance to the points in the nearest neighboring cluster) hisoblash: Bu qadamda har bir obyektning eng yaqin bo'lmagan klasterining barcha obyektlari bilan bo'lgan masofasi hisoblanadi. Uzluksizliklar o'rtasini topish uchun obyektlarning eng yaqin bo'lmagan klasteriga yaqinlik o'rtalamasi hisoblanadi. 4. Siluet koeffitsiyentini hisoblash: Siluet koeffitsiyenti, obyektning o'zining klasteriga yaqinlik o'rtalamasini (a(i)) va eng yaqin bo'lmagan klasteriga yaqinlik o'rtalamasini (b(i)) o'rnatingan formula yordamida hisoblanadi. Siluet koeffitsiyenti (silhouette coefficient) quyidagi formuladan foydalanilarak hisoblanadi: Siluet_koeffitsiyenti(i) = (b(i) - a(i)) / max(a(i), b(i)) Ushbu koeffitsiyent obyektning siluet koeffitsiyentini ifodalaydi. 5. Obyektlar uchun siluet koeffitsiyentlarini hisoblash: Klasterlash jarayonida har bir obyektning siluet koeffitsiyenti hisoblanadi. Bunda obyektning o'zining klasteriga yaqinlik o'rtalamasi va eng yaqin bo'lmagan klasteriga yaqinlik o'rtalamasi hisoblanadi va siluet koeffitsiyenti aniqlanadi. 6. O'rtacha siluet koeffitsiyentini hisoblash: Barcha obyektlarning siluet koeffitsiyentlarining o'rtachasi hisoblanadi. Bu o'rtacha siluet koeffitsiyenti klasterlashning umumiy sifatini ifodalaydi. Siluet baholash usuli klasterlashning sifatini objektiv baholash uchun ishlatiladi va klasterlash algoritmlarini taqqoslash, klasterlar sonini va klasterlash parametrlarini tanlashda yordam beradi. Obyektlarning klasterlarga moslashishi va klasterlashning samarali yoki samarasizligini aniqlash uchun siluet baholashdan foydalaniladi. Download 470.85 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling