51. O‘qituvchili o‘qitish (Supervised learning) algoritmlaridan chiziqli regressiyani kengroq yoritib bering


Ma’lumotlarga dastlabki ishlov berishda xususiyatlarni ajratib olish qanday ahamiyatga ega?


Download 33.99 Kb.
bet5/7
Sana23.01.2023
Hajmi33.99 Kb.
#1111442
1   2   3   4   5   6   7
58. Ma’lumotlarga dastlabki ishlov berishda xususiyatlarni ajratib olish qanday ahamiyatga ega?

  • Ma'lumotni tozalash: etishmayotgan qiymatlarni to'ldiring, shovqinli ma'lumotlarni va chet elliklarni aniqlang va olib tashlang.

  • Ma'lumotlarni o'zgartirish: o'lcham va shovqinni kamaytirish uchun ma'lumotlarni normallashtiring.

  • Ma'lumotlarni qisqartirish. Ma'lumotlarni qayta ishlashni soddalashtirish uchun yozuvlar yoki ma'lumotlar atributlariga misollar.

  • Ma'lumotlarni diskretlashtirish. Mashinani o'rganishning muayyan usullaridan foydalanishni osonlashtirish uchun uzluksiz atributlarni kategorik atributlarga aylantiring.

  • Matnni tozalash - masalan, yorliq bilan ajratilgan faylga o'rnatilgan yorliqlar, yozuvlarni buzishi mumkin bo'lgan o'rnatilgan yangi qatorlar kabi ma'lumotlar hizalanishini buzishi mumkin bo'lgan o'rnatilgan belgilarni olib tashlaydi.

59. O‘qituvchisiz o‘qitish (Unsupervised learning) ning klasterlash usulini nima maqsadlarda qo‘llaniladi? Misollar yordamida yoritib bering.
Unsupervised learning--  bu yorliqsiz ma'lumotlar to'plamini taqdim etishi, tahlil qilish va ichidagi naqshlarni topish uchun zarur. Misollar o'lchamlarni qisqartirish va klasterlashdir. Trening mashinaga etiketlanmagan, tasniflanmagan yoki toifalanmagan ma'lumotlar guruhi va ushbu ma'lumotlarni nazoratsiz osonlashtirish uchun zarur bo'lgan algoritm bilan qo'llab-quvvatlanadi. Nazoratsiz o'qitishning maqsadi kirish yozuvini yangi xususiyatlar yoki bir xil naqshli ob'ektlar to'plamiga qayta qurishdir.
Klaster tahlili ushbu yozuvlar bo'yicha amalga oshirilgan turli tadbirlarga qarab bir xil yozuvlarning guruhlari yoki klasterlarini shakllantirish uchun ishlatiladi. Asosiy dizayn klasterlarni tahlil maqsadi uchun foydali bo'lishi mumkin bo'lgan usullar bilan aniqlashdir. Bu maʼlumotlar astronomiya, arxeologiya, tibbiyot, kimyo, taʼlim, psixologiya, tilshunoslik va sotsiologiya kabi bir qancha sohalarda qoʻllanilgan.
Google klasterlash misollari bo'lib, yangiliklarni ularning mazmuniga bog'liq holda guruhlashni nazoratsiz o'rganishni talab qiladi. Google bir nechta mavzularda yozilgan millionlab yangiliklar to'plamiga ega va ularning klasterlash algoritmi so'z chastotasi, jumla uzunligi, sahifalar soni va boshqalarni o'z ichiga olgan bir nechta atributlardan foydalangan holda bir xil yoki bir-biri bilan bog'langan kichik raqamlarga guruhlanadi.
Nazoratsiz o'qitishning turli misollari mavjud, ular quyidagilardan iborat -

Download 33.99 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling