Ma’ruza rejasi O’qituvchisiz o’qitish Clusterlash tushunchasi k-means algoritmi O’qituvchili o’qitish


Download 1.52 Mb.
Sana25.01.2023
Hajmi1.52 Mb.
#1119330
Bog'liq
Clusterlash


Unsupervised learning (O’qituvchisiz o’qitish)

Ma’ruza rejasi

  • O’qituvchisiz o’qitish
  • Clusterlash tushunchasi
  • K-Means algoritmi

O’qituvchili o’qitish


O’qituvchili o’qitishda: yorliqlangan ma’lumot beriladi.
model/
predictor
label
label1
label3
label4
label5

Unsupervised learning


Unupervised learning: ma’lumot beriladi, lekin yorliqlamasdan

Unsupervised learning


Yorliqsiz ba'zi bir ma’lumotlarni keltirgan holda, biror narsa qilish!

Unsupervised learning: clustering


Dataset
Xususiyatlarni ajratish
f1, f2, f3, …, fn
f1, f2, f3, …, fn
f1, f2, f3, …, fn
f1, f2, f3, …, fn
f1, f2, f3, …, fn
Xususiyatlar
Guruhlarga ajratish/clusterlash
"Nazorat" yo'q, bizga faqat ma'lumot beriladi va tabiiy guruhlarni topishni xohlaymiz
Clusterlar

Face Clustering

Face clustering

Search result clustering

Aniq klaster tuzilishiga ega ma'lumotlar to'plami


Klasterlash uchun qanday muammolar mavjud?
Qanday klasterlash algoritmlari mavjud?

K-means

Eng taniqli va mashhur klasterlash algoritmi:

Taxminiy dastlabki klaster markazlari tanlang

Iteratsiya:

Har bir misolni eng yaqin markazga belgilang / klasterlang

Klasterdagi nuqtalarning o'rtacha qiymati sifatida markazlarni qayta hisoblang

K-means: Misol

K-means: Markazlarni tasodifiy ravishda tanlash

K-means: markazga eng yaqinligi bo’yicha guruhlash

K-means: markazlarni qayta sozlash

K-means: markazga eng yaqinligi bo’yicha guruhlash


K-means: markazlarni qayta sozlash
K-means: markazga eng yaqinligi bo’yicha guruhlash

K-means: markazlarni qayta sozlash


Boshqa o’zgartirilmaydi: TOMOM
K-means: markazga eng yaqinligi bo’yicha guruhlash

K-means

Iteratsiya :

Har bir misolni eng yaqin markazga belgilang / klasterlang

Klasterdagi nuqtalarning o'rtacha qiymati sifatida markazlarni qayta hisoblang


Bu qanday amalga oshiriladi?

K-means


iteratsiya:
    • Har bir misolni eng yaqin markazga belgilang / klasterlang

    • har bir nuqta ustida takrorlang :
      - har bir klaster markaziga masofani oling
      - eng yaqin markazga tayinlash (qattiq klaster)
    • Klasterdagi nuqtalarning o'rtacha qiymati sifatida markazlarni qayta hisoblang

Masofa o'lchovlari

Euclidean masofasi:

cosine similarity (kosinus o'xshashligi)


ikki vektor orasidagi burchak bilan o'zaro bog'liq holda hisoblanadi

K-means


Klaster markazi qayerda?
Itiratsiya:
Har bir misolni eng yaqin markazga belgilash / klasterlash
Klasterdagi nuqtalarning o'rtacha qiymati sifatida markazlarni qayta hisoblash

K-means


Bu qanday hisoblanadi?

Itiratsiya:

Har bir misolni eng yaqin markazga belgilash / klasterlash

Klasterdagi nuqtalarning o'rtacha qiymati sifatida markazlarni qayta hisoblash

K-means

Itiratsiya:

Har bir misolni eng yaqin markazga belgilash / klasterlash

Klasterdagi nuqtalarning o'rtacha qiymati sifatida markazlarni qayta hisoblash


Klasterdagi nuqtalarning o'rtacha qiymati :
Bu yerda:

Eng uzoq markaz

μ1 = tasodifiy nuqtani tanlang

for i = 2 to K:

μi = oldingi markazlardan eng uzoq bo'lgan nuqta


x dan oldingi har qanday markazgacha bo'lgan eng kichik masofa
oldingi har qanday markazga eng katta masofa bilan nuqta
Birinchi markaz uchun tasodifiy nuqtani tanlash
Keyinchalik qaysi nuqta tanlanadi?
K-means: Markazlarni aniqlash

K-means: Markazlarni aniqlash


Markazdan eng uzoq nuqta
Keyinchalik qaysi nuqta tanlanadi?
K-means: Markazlarni aniqlash
Download 1.52 Mb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling