Ma’lumotlarga dastlabki ishlov berish
Ma’lumotlar turini belgilash (Format): O’qituvchi to’plamdagi ma’lumotlar
turi va toifasini moslashtirish (Misol uchun, o’qitiluvchi to’plam sifatida 100 t rasm
olingan bo’lsin, rasmlar har xil o’lchamda yoki har xil fayl formatida bo’lishi mumkin).
Ma’lumotlarni tozalash (Data Cleaning): Ushbu bosqichda ma’lumotlar
orasidan ortiqcha yoki ahamiyati past bo’lgan (masalan, sifati juda past bo’lgan
tasvirlar, o’lchami juda kichik bo’lgan rasmlar), model turg’unligiga ta’sir
qiluvchi
ma’lumotlar olib tashlanadi.
Ushbu bosqichda o’qituvchi
to’plamdagi ma’lumotlar xususiyatlari o’rganib chiqiladi va bashoratlash, tashxislash,
sinflashtirish, qaror qabul qilish uchun kerakli xususiyatlar ajratib olinadi. (Misol uchun
rasmda “olma” tasvirlanganligini belgilab beruvchi xusisyatlar).
7.4-rasm. Dastlabki
ishlov berish jarayoni
Unsupervised learning
O’qituvchisiz o’qitish (unsupervised learning) – bu mashinani o’qitish usulidan
biri bo’lib, bunda modelni oldindan aniq bo’lgan ma’lumotlar bilan o’qitish
amalga
oshirilmaydi, aksincha obyekt parametrlarini (ma'lumotlarni) toppish uchun modelga
o'z ustida ishlashga imkon yaratib beriladi.
Supervised learning usuliga qaraganda murakkab usul hisoblanadi
va bashoratlash
jarayoni avtomatik lekin noaniqroq bo’lishi mumkin.
Unsupervised learning usulida asosan “klasterlash” masalasi yechiladi.
7.5-rasm. Unsupervised learning ga misol
Unsupervised learning: “Klasterlash”
Unsupervised learning turlari
• Clustering
• Hierarchical clustering
• K-means clustering
• K-NN (k nearest neighbors)
• Principal Component Analysis
• Singular Value Decomposition
• Independent
Component Analysis
Artificial intelligance with ML