19-Amaliy mashg’ulot: Tayanch vektorlar mashinalari
Download 195.72 Kb. Pdf ko'rish
|
19-mavzu
19-Amaliy mashg’ulot: Tayanch vektorlar mashinalari Mashinani o'rganishda qo'llab-quvvatlovchi vektorli mashinalar (Tayanch vektorlar mashinalari'lar, shuningdek, qo'llab-quvvatlovchi vektor tarmoqlari 1) tasniflash va regressiya tahlili uchun ma'lumotlarni tahlil qiladigan bog'liq o'rganish algoritmlari bilan nazorat qilinadigan o'rganish modellari. AT&T Bell Laboratoriesda Vladimir Vapnik tomonidan hamkasblari bilan ishlab chiqilgan (Boser va boshq., 1992, Guyon va boshq., 1993, Cortes va Vapnik, 1995,2 Vapnik va boshq., 1997iqtibos keltirish kerak) Tayanch vektorlar mashinalarilar quyidagilardan biridir. Vapnik (1982, 1995) va Chervonenkis (1974) tomonidan taklif qilingan statistik o'rganish asoslari yoki VC nazariyasiga asoslangan eng ishonchli bashorat usullari. Har biri ikkita toifadan biriga tegishli deb belgilangan o‘quv misollari to‘plamini hisobga olgan holda, Tayanch vektorlar mashinalari o‘qitish algoritmi bir yoki boshqa toifaga yangi misollar tayinlaydigan modelni yaratadi va uni ehtimollik bo‘lmagan ikkilik chiziqli klassifikatorga aylantiradi (garchi Platt kabi usullar bo‘lsa ham. Tayanch vektorlar mashinalarini ehtimolli tasniflash sozlamalarida ishlatish uchun masshtablash mavjud). Tayanch vektorlar mashinalari ikkita toifa orasidagi bo'shliqning kengligini maksimal darajada oshirish uchun o'quv misollarini kosmosdagi nuqtalarga xaritalaydi. Keyin yangi misollar bir xil bo'shliqqa joylashtiriladi va ular bo'shliqning qaysi tomoniga tushib qolganiga qarab toifaga tegishli ekanligi taxmin qilinadi. Chiziqli tasnifni amalga oshirishdan tashqari, Tayanch vektorlar mashinalarilar yadro hiylasi deb ataladigan narsadan foydalangan holda chiziqli bo'lmagan tasnifni samarali bajarishi mumkin, bu esa o'z kirishlarini yuqori o'lchamli xususiyat bo'shliqlariga sozlab beradi. Ma'lumotlar belgilanmagan bo'lsa, nazorat ostida o'rganish mumkin emas va nazoratsiz o'rganish yondashuvi talab qilinadi, bu ma'lumotlarning guruhlarga tabiiy klasterlanishini topishga va keyin yangi ma'lumotlarni ushbu shakllangan guruhlarga solishtirishga harakat qiladi. Hava Siegelmann va Vladimir Vapnik tomonidan yaratilgan qo'llab-quvvatlovchi vektorli klasterlash3 algoritmi yorliqsiz ma'lumotlarni turkumlash uchun qo'llab-quvvatlovchi vektor mashinalari algoritmida ishlab chiqilgan qo'llab-quvvatlovchi vektorlar statistikasini qo'llaydi. Ma'lumotlarni tasniflash mashinani o'rganishda keng tarqalgan vazifadir. Aytaylik, ba'zi berilgan ma'lumotlar nuqtalarining har biri ikkita sinfdan biriga tegishli va maqsad yangi ma'lumotlar nuqtasi qaysi sinfga tegishli bo'lishini aniqlashdir. Qo'llab-quvvatlovchi vektorli mashinalarda ma'lumotlar nuqtasi p sifatida qaraladi. p-o'lchovli vektor ( pp raqamlari ro'yxati) va biz bunday nuqtalarni (p-1)(p-1)- o'lchovli giperplan bilan ajratishimiz mumkinligini bilmoqchimiz. Bu chiziqli tasniflagich deb ataladi. Ma'lumotlarni tasniflashi mumkin bo'lgan ko'plab giperplanlar mavjud. Eng yaxshi giperplane sifatida oqilona tanlovlardan biri bu ikki sinf o'rtasidagi eng katta ajratish yoki chegarani ifodalovchi variantdir. Shunday qilib, biz giperplanani shunday tanlaymizki, undan har tomondan eng yaqin ma'lumot nuqtasigacha bo'lgan masofa maksimal bo'ladi. Agar shunday giper tekislik mavjud bo'lsa, u maksimal chegarali giper tekislik va u belgilaydigan chiziqli klassifikator maksimal chegara klassifikatori deb nomlanadi; yoki ekvivalenti, optimal barqarorlikning perseptroni Rasmiyroq qilib aytganda, qoʻllab-quvvatlovchi vektorli mashina yuqori yoki cheksiz oʻlchamli fazoda giperplan yoki giperplanlar toʻplamini yaratadi, undan tasniflash, regressiya yoki chetdagilarni aniqlash kabi boshqa vazifalar uchun foydalanish mumkin.4 Intuitiv ravishda yaxshi ajratish har qanday sinfning eng yaqin o'quv ma'lumotlar nuqtasiga (funktsional chegara deb ataladigan) eng katta masofaga ega bo'lgan giperplan orqali erishiladi, chunki umuman olganda, chegara qanchalik katta bo'lsa, tasniflagichning umumlashtirish xatosi shunchalik past bo'ladi. Yadro mashinasi Dastlabki muammo chekli o'lchovli fazoda ifodalanishi mumkin bo'lsa-da, ko'pincha diskriminatsiya qilinadigan to'plamlar bu fazoda chiziqli ravishda ajratilmaydi. Shu sababli, dastlabki chekli o'lchovli fazoni ancha yuqori o'lchamli fazoga solishtirish taklif qilindi, bu esa bu bo'shliqda ajratishni osonlashtiradi. Hisoblash yukini oqilona ushlab turish uchun Tayanch vektorlar mashinalari sxemalari tomonidan qo'llaniladigan xaritalar kirish ma'lumotlari vektorlari juftlarining nuqta mahsulotini yadro funktsiyasi nuqtai nazaridan aniqlash orqali dastlabki fazodagi o'zgaruvchilar nuqtai nazaridan osongina hisoblashni ta'minlash uchun mo'ljallangan. muammoga mos ravishda tanlangan.7 Yuqori o'lchamli fazodagi giperplanlar bu fazodagi vektorga ega bo'lgan nuqta mahsuloti doimiy bo'lgan nuqtalar to'plami sifatida aniqlanadi, bunda bunday vektorlar to'plami giperplanni belgilaydigan ortogonal (va shuning uchun minimal) vektorlar to'plamidir. Giper tekisliklarni belgilovchi vektorlar parametrlar bilan chiziqli birikmalar sifatida tanlanishi mumkin alpha _i xususiyat vektorlari tasvirlarining x_ix_i. ma'lumotlar bazasi. Giper tekislikning bunday tanlanishi bilan giper tekislikka tushirilgan xususiyat fazosidagi xx nuqtalari textstyle sum _ialpha _ik(x_) munosabati bilan aniqlanadi. i,x)=textconstant. textstyle sum _ialpha _ik(x_i,x)=textconstant . E'tibor bering, agar k(x,y) k(x,y) yy xx dan uzoqlashgani sari kichik bo'lsa, yig'indidagi har bir a'zo test nuqtasi xx mos keladigan ma'lumotlar bazasi nuqtasiga x_ix_i yaqinlik darajasini o'lchaydi. Shu tarzda, yuqoridagi yadrolar yig'indisi har bir sinov nuqtasining diskriminatsiya qilinadigan to'plamlarning bir yoki boshqasida kelib chiqadigan ma'lumotlar nuqtalariga nisbatan yaqinligini o'lchash uchun ishlatilishi mumkin. Download 195.72 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling