1-ma’ruza. Berilganlarni intellektual tahliliga kirish


Download 2.17 Mb.
bet10/44
Sana14.09.2023
Hajmi2.17 Mb.
#1678091
1   ...   6   7   8   9   10   11   12   13   ...   44
Bog'liq
1-ma\'ruza. BITga kirish

ISODATA algoritmi k o‘rtacha algoritmiga asoslanadi, biroq amaliyotda foydalagini ko‘rsatgan evristika va ularni sozlash parametrlarini o‘z ichiga oladi. Aprior sifatida beriladigan parametrlardan biri – bu klasterlar soni K. Bu son tavsiya sifatida ishlatiladi: algoritm ishlash jarayonidan undan kam sondagi yoki katta sondagi klasterlar qurilishi mumkin, lekin ular K sonidan keskin farq qilmaydi. Algoritmni to‘liq keltirmagan holda unda ishlatiladigan asosiy evristikalarni keltiramiz:

  1. Berilgan sondan kam elementlarga ega klasterlar yo‘q qilinadi.

  2. Ayni paytdagi har bir klaster uchun maksimal cho‘zilganlik qo‘nalishi aniqlanadi. Eng cho‘zilgan klaster ikkitaga ajratilishi mumkin. Ajratish bo‘yicha qaror, klaster o‘lchami va cho‘zilganlik yo‘nalishi inobatga olgan holda qabul qilinadi (ushbu o‘lcham fiksirlangan bo‘sag‘a va barcha klasterlarning o‘rtacha o‘lchamidan cheklanish bilan hamda kam bo‘lishi kerak bo‘lgan klasterlar umumiy soni (K parametrini inobatga olgan holda) bilan solishtirilishi mumkin).

  3. Agar klasterlar soni ko‘p bo‘lsa, markazlari o‘rtalaridagi masofa berilgan bo‘sag‘adan qichik bo‘lgan klasterlar birlashtiriladi (K parametrini inobatga olgan holda).

Yuqorida sanab o‘tilgan klasterlash algoritmlari o‘z mohiyatiga ko‘ra iterativ hisoblanib, guruhlashning mumkin bo‘lgan barcha variantlarini ko‘rib chiqishni cheklab o‘tish imkonini beradi, lekin bu usullar sinflar markazini joylashishi haqidagi boshlang‘ich gipotezaga va tanlanma obyektlarini taqdim etish ketma-ketligiga sezgir hisoblanadi. ISODATA algoritmida qo‘llaniladigan evristikalar nafaqat ma’qul bo‘lgan sinflar sonini tanlashga, balki maqbul yechim topishga, boshlang‘ich gipotezaga bog‘liqlikni yumshatishga (ularni to‘liq inkor qilmagan holda) yordam beradi.
Klasterlash algoritmlarining yana bitta muammosi - bu aprior tarzda masofa o‘lchami berilishi algoritm imkoniyatini keskin cheklaydi. Masalan, evklid masofasini ishlatilganda, qurilayotgan sinflar har doim chiziqli ajraluvchi bo‘ladi, mashinali o‘rgatish tizimlari tomonidan bu sinflarga mos keluvchi tomonidan aniqlangan tushunchalar yetarlicha sodda bo‘ladi.

Download 2.17 Mb.

Do'stlaringiz bilan baham:
1   ...   6   7   8   9   10   11   12   13   ...   44




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling