1. Mashinada o'qitishning asosiy turlari Mashinali o'qitish modellari uchun asosiy algoritmlar


Nazorat qilinmasdan mashinalarni o'rganish


Download 18.15 Kb.
bet2/2
Sana28.08.2023
Hajmi18.15 Kb.
#1670985
1   2
Bog'liq
2-ma\'ruza(sirtqi) (1)

1.2. Nazorat qilinmasdan mashinalarni o'rganish
Nazorat qilinmasdan o'rganish holatida, tizimga tayyor "to'g'ri javoblar" berilmaganida, barchasi yanada qiziqroq. Masalan, bizda ma'lum miqdordagi odamlarning vazni va bo'yi haqida ma'lumot bor va bu ma'lumotlarni uch guruhga bo'lish kerak, ularning har biri uchun mos o'lchamdagi ko'ylaklarni tikishimiz kerak. Bu klasterlash vazifasi. Bunday holda, barcha ma'lumotlarni 3 ta klasterga bo'lish kerak bo'ladi (lekin, qoida tariqasida, bunday qat'iy va faqat mumkin bo'linish mavjud emas).

Agar biz boshqa vaziyatni olsak, namunadagi har bir ob'ekt yuz xil xususiyatga ega bo'lsa, unda asosiy qiyinchilik bunday namunaning grafik ko'rinishi bo'ladi. Shuning uchun funktsiyalar soni ikkitaga yoki uchtaga qisqartiriladi va ularni tekislikda yoki 3D-da tasavvur qilish mumkin bo'ladi. Bu o'lchovni kamaytirish muammosi.




2 Mashinali o'qitish modellari uchun asosiy algoritmlar
2.1. Qaror daraxti
Bu daraxtga o'xshash grafikadan foydalanishga asoslangan qarorlarni qo'llab-quvvatlash usuli: ularning yuzaga kelishi mumkin bo'lgan oqibatlarini hisobga olgan holda qaror qabul qilish modeli (hodisa yuzaga kelishi ehtimolini hisoblash bilan), samaradorlik, resurslarni sarflash.
Biznes-jarayonlar uchun ushbu daraxt minimal miqdordagi savollardan iborat bo'lib, ular aniq javobni talab qiladi - "ha" yoki "yo'q". Bu savollarning barchasiga doimiy ravishda javob berib, to'g'ri tanlovga kelamiz. Qaror daraxtining uslubiy afzalliklari shundaki, u muammoni tuzadi va tizimga soladi va yakuniy qaror mantiqiy xulosalar asosida qabul qilinadi.
2.2. Bayeslarning sodda tasnifi
Bayescha sodda tasniflagichlar oddiy ehtimollik klassifikatorlari oilasiga mansub va Bayes teoremasidan kelib chiqadi, bu holda funktsiyalarni mustaqil deb hisoblaydi (bu qat'iy yoki sodda, taxmin deb ataladi). Amalda, u mashinasozlikning quyidagi yo'nalishlarida qo'llaniladi:
• elektron pochtaga keladigan spam-spam ta'rifi;
• yangiliklar maqolalarini tematik sarlavhalar bilan avtomatik ravishda bog'lash;
• matnning emotsional rangini aniqlash;
• tasvirlardagi yuzlar va boshqa naqshlarni tanib olish.
2.3. Eng kam kvadratchalar usuli
Statistikani ozgina bo'lsa ham o'rgangan kishi chiziqli regressiya tushunchasini yaxshi biladi. Eng kichik kvadratchalar ham uni amalga oshirish variantlariga tegishli. Odatda, chiziqli regressiya ko'plab nuqtalardan o'tgan to'g'ri chiziqni o'rnatish masalalarini hal qilish uchun ishlatiladi. Bu eng kichik kvadratlar usuli yordamida amalga oshiriladi: to'g'ri chiziqni torting, undan har bir nuqtagacha bo'lgan masofani o'lchang (nuqtalar va chiziq vertikal segmentlar bilan bog'langan), natijada olingan summani ko'chiring. Natijada, masofalar yig'indisi eng kichik bo'ladigan egri chiziq kerakli (bu chiziq haqiqiy qiymatdan normal taqsimlangan og'ish bilan nuqtalar orqali o'tadi).
Ma'lumotlarni mashinada o'rganish uchun moslashtirishda chiziqli funktsiya odatda qo'llaniladi va xato metrikasini yaratish orqali xatolarni minimallashtirish uchun eng kichik kvadratchalar usuli qo'llaniladi.
2.4. Logistik regressiya
Logistik regressiya bu o'zgaruvchilardan o'zaro bog'liqlikni aniqlash usulidir, ulardan biri qat'iyan bog'liq, boshqalari esa mustaqil. Buning uchun logistik funktsiyadan (akkumulyativ logistik taqsimot) foydalaniladi. Logistik regressiyaning amaliy qiymati shundaki, u bir yoki bir nechta mustaqil o'zgaruvchini o'z ichiga olgan voqealarni bashorat qilishning kuchli statistik usuli hisoblanadi. Bu quyidagi holatlarda foydalidir:
kredit ballari;
• reklama kampaniyalarining muvaffaqiyatini o'lchash;
• ma'lum bir mahsulotdan foyda prognozi;
• ma'lum bir sanada zilzila ehtimolini taxmin qilish.
2.5. Vektorli mashinani qo'llab-quvvatlash (SVM)
Bu tasniflash va regressiya tahlili masalalarini hal qilish uchun zarur bo'lgan algoritmlarning butun to'plamidir. N o'lchovli kosmosdagi ob'ekt ikki sinfdan biriga tegishli ekanligiga asoslanib, qo'llab-quvvatlovchi vektorli mashina barcha ob'ektlar ikki guruhdan birida bo'lishi uchun (N - 1) o'lchovli giperplan yaratadi. Qog'ozda uni quyidagicha ifodalash mumkin: ikki xil nuqtalar mavjud va ularni chiziqli ajratish mumkin. Ushbu usul nuqtalarni ajratishdan tashqari, har bir guruhning eng yaqin nuqtasidan iloji boricha uzoqroq joyda giperplan hosil qiladi.

SVM va uning modifikatsiyalari mashinani o'rganishning DNKni biriktirish, fotosuratdan odamning jinsini aniqlash, veb-saytlarda reklama bannerlarini namoyish qilish kabi murakkab muammolarni hal qilishga yordam beradi.


2.6. Ansambllar usuli
Bu tasniflagichlar to'plamini yaratadigan va ularning o'rtacha yoki ovoz berish natijalariga ko'ra barcha olingan ob'ektlardan yangi ob'ektlarni ajratib turadigan mashinalarni o'rganish algoritmlariga asoslanadi. Dastlab ansambl usuli Bayesning o'rtacha ko'rsatkichi bo'lgan, ammo keyinchalik u yanada murakkablashdi va qo'shimcha algoritmlar bilan to'lib toshdi:
• kuchaytirish - klassifikatorlar ansamblini shakllantirish orqali zaif modellarni kuchli modellarga aylantiradi (matematik nuqtai nazardan, bu yaxshilanadigan kesishma);
• sumkalar - bir vaqtning o'zida asosiy sinflarni o'qitishda (birlashishni takomillashtirishda) murakkab klassifikatorlarni yig'adi;
• chiqishni kodlash xatolarini tuzatish.
Ansambl usuli mustaqil prognozlash modellariga qaraganda kuchliroqdir, chunki:
• har bir tayanch tasniflagichining xatolarini o'rtacha hisoblash orqali tasodif ta'sirini minimallashtiradi;
• farqni kamaytiradi, chunki har xil farazlarga asoslangan bir necha xil modellar alohida olingan natijalarga qaraganda to'g'ri natijaga erishish ehtimoli ko'proq;
• to'plamdan tashqariga chiqishni istisno qiladi: agar jamlangan gipoteza asosiy farazlar to'plamidan tashqarida bo'lsa, unda birlashtirilgan gipotezani shakllantirish bosqichida u u yoki bu usul yordamida kengaytiriladi va gipoteza allaqachon unga kiritilgan.
Download 18.15 Kb.

Do'stlaringiz bilan baham:
1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling