Qisman o'qitish masalalarini yechish uchun klasterizatsiya algoritmlarini moslashtirish


Download 0.65 Mb.
bet5/6
Sana23.02.2023
Hajmi0.65 Mb.
#1223515
1   2   3   4   5   6
Bog'liq
QISMAN O\'QITISH MASALALARINI YECHISH UCHUN KLASTERIZATSIYA ALGORITMLARINI MOSLASHTIRISH

4 TAJRIBA VA NATIJALAR
4.1 Kirish
Ushbu algoritmlarning ishlashini sinab ko'rish va solishtirish uchun biz ba'zi tasniflash algoritmlari bo'yicha tajribalar o'tkazamiz.
Bizning tajribamizda biri tasniflashning ikkita katta oilasiga (bo'linish, ierarxik) ta'sir qiluvchi uchta algoritm bilan ishladi: birinchi oila uchun K-means va CLARA, ikkinchisi uchun BIRCH. Ushbu uchta algoritm biznikiga o'xshash muammolarni hal qilishda samaradorligini isbotladi. Haqiqatan ham, CLARA algoritmlaridan biri katta hajmdagi ma'lumotlar manbalarini davolashi mumkin, bu bizning holatimizga mos keladi. Boshqa tomondan, BIRCH o'rganilayotgan bazaga ko'ra muhim ekstraktlarni ko'rib chiqmaydi.
Bizning tajribamizda biri tasniflashning ikkita katta oilasiga (bo'linish, ierarxik) ta'sir qiluvchi uchta algoritm bilan ishladi: birinchi oila uchun K-means va CLARA, ikkinchisi uchun BIRCH. Ushbu uchta algoritm biznikiga o'xshash muammolarni hal qilishda samaradorligini isbotladi. Haqiqatan ham, CLARA algoritmlaridan biri katta hajmdagi ma'lumotlar manbalarini davolashi mumkin, bu bizning holatimizga mos keladi. Boshqa tomondan, BIRCH o'rganilayotgan bazaga ko'ra muhim ekstraktlarni ko'rib chiqmaydi.

6-rasm: Tavsiya etilgan tahlil modeli.
Biz dastlab klasterlash algoritmlarini sinab ko'ramiz, masalan: Kmeans, Klara va qayin. Har bir algoritm uchun eng yaxshi parametrlarni aniqlash maqsadida individual testlar qatori o'tkaziladi. Keyinchalik qiyosiy o'rnatish uchun barcha algoritmlar uchun ko'rsatkichlar (bajarish vaqti, natijalar sifati ...) o'lchanadi.
Barcha testlar Microsoft Windows © XP Professional tizimida ishlaydigan 2 GB operativ xotiraga ega Intel I3 o'rnatilgan Toshiba mashinasida amalga oshiriladi.
4.2 Algoritmlarning tavsifi
4.2.1 Algoritm K- degani
K-means algoritmi [1] klasterlash sohasida standart hisoblanadi. Amalga oshirishning soddaligi va katta aholini boshqarish qobiliyati.
Algoritm k parametrini, siz xohlagan sinflar sonini oladi va quyidagicha umumlashtirilishi mumkin:

Download 0.65 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling