4-Amaliy mashg’ulot Reja


Ma'lumotlarni qidirishda bo'lish usuli (K-O'rtacha)


Download 210.5 Kb.
bet4/7
Sana19.06.2023
Hajmi210.5 Kb.
#1622016
1   2   3   4   5   6   7
Bog'liq
4-Amaliy ish

2.Klasterlash va qismli o'qitish algoritmlari

Ma'lumotlarni qidirishda bo'lish usuli (K-O'rtacha)


Bo'lish usuli: Ushbu klasterlash usuli ma'lumotlarning xususiyatlari va o'xshashligi asosida ma'lumotlarni bir nechta guruhlarga ajratadi. Uning ma'lumotlar tahlilchilari klasterlash usullari uchun yaratilishi kerak bo'lgan klasterlar sonini aniqlaydi. Bo'lish usulida bir nechta (N) ob'ektni o'z ichiga olgan ma'lumotlar bazasi (D) bo'lsa, bo'linish usuli foydalanuvchi tomonidan belgilangan (K) ma'lumotlar bo'limlarini tuzadi, unda har bir bo'lim klaster va ma'lum bir hududni ifodalaydi. Bo'lish usuli ostida bo'lgan ko'plab algoritmlar mavjud, ulardan ba'zilari K-Mean, PAM(K-Medoids), CLARA algoritmi (Klastering Large Applications) va boshqalar. Ushbu maqolada K Mean algoritmining ishlashini ko'rib chiqamiz. tafsilot. K-Mean (Centroidga asoslangan texnika):K degan ma'noni anglatadi algoritmi foydalanuvchidan K kirish parametrini oladi va N ta ob'ektni o'z ichiga olgan ma'lumotlar to'plamini K klasterlarga bo'linadi, natijada guruh ichidagi ma'lumotlar ob'ektlari (intraklaster) o'rtasidagi o'xshashlik yuqori bo'ladi, lekin ma'lumotlar ob'ektlarining tashqi ma'lumotlar ob'ektlari bilan o'xshashligi. klaster past (klasterlararo). Klasterning o'xshashligi klasterning o'rtacha qiymatiga qarab aniqlanadi. Bu kvadrat xato algoritmining bir turi. Boshida tasodifiy ravishda ma'lumotlar to'plamidan k ob'ekt tanlanadi, bunda ob'ektlarning har biri klaster o'rtacha (markazi)ni ifodalaydi. Ma'lumotlar ob'ektlarining qolgan qismi uchun ular klaster o'rtacha qiymatidan masofaga qarab eng yaqin klasterga tayinlanadi. Keyin har bir klasterning yangi o'rtacha qiymati qo'shilgan ma'lumotlar ob'ektlari bilan hisoblanadi. 
Algoritm:
K degani:


Kiritish:
K: Ma'lumotlar to'plami bo'linishi kerak bo'lgan klasterlar soni
D: N ta ob'ektni o'z ichiga olgan ma'lumotlar to'plami
Natija:
K klasterlarining ma'lumotlar to'plami
Usul:

  1. Ma'lumotlar to'plamidan (D) tasodifiy ravishda K ob'ektni klaster markazlari (C) sifatida tayinlang

  2. (Qayta) O'rtacha qiymatlar asosida ob'ektga eng o'xshash ob'ektni tayinlang.

  3. Yangilangan klaster degani, ya'ni har bir klasterning o'rtacha qiymatini yangilangan qiymatlar bilan qayta hisoblash.

  4. Hech qanday o'zgarish bo'lmaguncha 2-bosqichni takrorlang.

Download 210.5 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling