Tayanch vektorlar mashinalari

Download 226.5 Kb.

Sana	04.11.2023
Hajmi	226.5 Kb.
	#1745768

Bog'liq
14.Tayanch vektorlar mashinalari

Tayanch vektorlar mashinalari

Tasniflash va regressiya uchun ma'lumotlarni tahlil qiluvchi o’qituvchili o'rgatish algoritmidir. AT&T Bell Laboratoriyasida Vladimir Vapnik tomonidan hamkasblari bilan ishlab chiqilgan (Boser va boshq., 1992, Guyon va boshq., 1993, Cortes va Vapnik, 1995, Vapnik va boshqalar, 1997 ). Tayanch vektorlar mashinalari Vapnik (1982, 1995) va Chervonenkis (1974) tomonidan taklif qilingan statistik o’rganish tizimlari yoki VC nazariyasiga asoslangan ishonchli bashorat qilish usullaridan biridir .

Har biri ikkita toifadan biriga tegishli deb belgilangan o‘quv misollari to‘plamini hisobga olgan holda, Tayanch vektorlar mashinalari o‘qitish algoritmi yangi misollarni u yoki bu toifaga tayinlaydigan modelni yaratadi va uni ehtimollik bo‘lmagan ikkilik chiziqli klassifikatorga aylantiradi (garchi Platt kabi usullar bo‘lsa ham masshtablash Tayanch vektorlar mashinalaridan ehtimollik tasnifida foydalanish uchun mavjud). Tayanch vektorlar mashinalari ikkita toifa orasidagi bo'shliqning kengligini maksimal darajada oshirish uchun o'quv misollarini fazodagi nuqtalarga joylaydi. Keyin yangi misollar bir xil bo'shliqqa joylashtiriladi va ular oradagi bo'shliqning qaysi tomoniga tushib qolganiga qarab toifaga tegishli ekanligi taxmin qilinadi.
Chiziqli tasnifni amalga oshirishdan tashqari , Tayanch vektorlar mashinalari yadro o’zgarishi deb ataladigan narsadan foydalangan holda chiziqli bo'lmagan tasnifni samarali amalga oshirishi mumkin, bu esa o'z kirishlarini yuqori o'lchamli xususiyat bo'shliqlariga sozlab beradi.
M
a'lumotlar oldindan qaysi guruhga tegishliligi belgilanmagan bo'lsa, o’qituvchili o'rgatishni amalga oshirib bo’lmaydi. bu ma'lumotlarning guruhlarga tabiiy klasterlanishini topishga va keyin yangi ma'lumotlarni ushbu shakllangan guruhlarga solishtirishga harakat qiladi. Hava Siegelmann va Vladimir Vapnik tomonidan yaratilgan Tayanch vektorli klasterlash algoritmi guruhlarga ajratilmagan ma'lumotlarni toifalarga ajratish uchun Tayanch vektor mashinalari algoritmida ishlab chiqilgan Tayanch vektorlar statistikasini qo'llaydi.

Ma'lumotlarni tasniflash keng tarqalgan vazifadir . Aytaylik, ba'zi berilgan ma'lumotlar nuqtalarining har biri ikkita sinfdan biriga tegishli va maqsad yangi ma'lumotlar nuqtasi qaysi sinfga tegishli bo'lishini hal qilishdir . Tayanch vektorli mashinalarda ma'lumotlar nuqtasi p-o'lchovli vektor sifatida ko'riladi. Biz bunday nuqtalarni (p-1)- o'lchovli girpertekislik (giperplane) bilan ajratishimiz mumkinligini bilmoqchimiz. Bu chiziqli tasniflagich deb ataladi . Ma'lumotlarni tasniflashi mumkin bo'lgan ko'plab girpertekislik mavjud. Eng yaxshi girpertekislik sifatida oqilona tanlovlardan biri bu ikki sinf o'rtasidagi eng katta bo'linishni yoki chegarani ifodalovchi tanlovdir. Shunday qilib, biz girpertekislikni shunday tanlaymizki, undan har tomondan eng yaqin ma'lumot nuqtasigacha bo'lgan masofa maksimal bo'ladi.

Agar shunday giper tekislik mavjud bo'lsa, u maksimal chegarali gipertekislik va u belgilaydigan chiziqli tasniflovchi maksimal chegara tasniflovchisi deb nomlanadi.
Tayanch vektorlarli mashina yuqori yoki cheksiz o'lchamli fazoda gipertekislik yoki gipertekisliklar to'plamini quradi, undan tasniflash , regressiya yoki ma’lumot boshqa tekislikda ekanini aniqlash kabi boshqa vazifalar uchun foydalanish mumkin.
Yaxshi ajratishga har qanday sinfning eng yaqin o'quv ma'lumotlari nuqtasiga (funktsional chegara deb ataladigan) eng katta masofaga ega bo'lgan giperplan orqali erishiladi, chegara qanchalik katta bo'lsa, umumlashtirish xatosi shunchalik past bo'ladi .

D
astlabki muammo chekli o'lchovli fazoda ifodalanishi mumkin. Lekin ko'pincha tasniflanadigan to'plamlar bu fazoda chiziqli ravishda ajratib bo’lmaydi. Shu sababli, asl chekli o'lchovli fazoni yuqori roq o'lchamli fazoda solishtirishtiriladi, bu fazoda ajratishni osonlashtiradi. Hisoblashni osonlashtirish uchun Tayanch vektorlar mashinalari tomonidan qo'llaniladigan kirish ma'lumotlari vektorlari juftlarining ko’paytmasini yadro funktsiyasi k (x, y) orqali dastlabki fazodagi o'zgaruvchilar nuqtai nazaridan aniqlash orqali osongina hisoblashni ta'minlash uchun mo'ljallangan.

k (x, y) yadro funksiyasi muammoga mos ravishda tanlanadi. Yuqori oʻlchamli fazodagi gipertekisliklar bu fazodagi vektorga ega boʻlgan nuqta mahsuloti doimiy boʻlgan nuqtalar toʻplami sifatida aniqlanadi, bunda bunday vektorlar toʻplami ortogonal (shuning uchun minimal) vektorlar toʻplamidir, ular gipertekislik.

Download 226.5 Kb.

Do'stlaringiz bilan baham: