Muxammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti samarqand filiali kompyuter tizimlari kafedrasi kompyuter injiniring (Kompyuter injiniring, at-servis, Multimedia texnologiyalari) ta'lim yo'nalishi


Download 274.51 Kb.
Sana18.06.2023
Hajmi274.51 Kb.
#1576156
Bog'liq
4mashinali o`qitishga kirish


MUXAMMAD AL-XORAZMIY NOMIDAGI
TOSHKENT AXBOROT TEXNOLOGIYALARI UNIVERSITETI
SAMARQAND FILIALI

KOMPYUTER TIZIMLARI KAFEDRASI

Kompyuter injiniring (Kompyuter injiniring, AT-servis, Multimedia texnologiyalari) ta'lim yo'nalishi

Mashinali o’qitishga kirish” fanidan



MUSTAQIL ISH № 4


Mavzu: Sinflashtirish masalasi uchun logistik funksiyalaridan foydalanish.

Bajardi: 3-kurs talabasi Axmadov F.


Qabul qildi: Kubayev S.T.

Samarqand – 2023
Mavzu: Sinflashtirish masalasi uchun logistik funksiyalaridan foydalanish.
Reja:
1. Sinflashtirish masalasi uchun logistik va softmax regressiya funksiyalaridan foydalanish
2. Samaradorlikni baxolash usullari tartibsizlik matritsasi (confusion matrix).
3. MNIST o’quv tanlanma tuzilishi

Logistik regressiya va softmax regressiyasi


Logistik regressiya - bu maqsadli o'zgaruvchiga ega bo'lganda ishlatiladigan ikkilik tasniflash algoritmi faqat ikkita mumkin bo'lgan natija. U ma'lum bir narsaga tegishli kirish ehtimolini modellashtiradi logistik funktsiyani kirish xususiyatlariga moslash orqali sinf. Logistik funktsiya S- deb talqin qilinishi mumkin bo'lgan 0 dan 1 gacha bo'lgan qiymatni chiqaradigan shaklli egri chiziq ijobiy sinfga tegishli kirish ehtimoli. Logistik regressiyani o'rgatish mumkin


maksimal ehtimollikni baholashdan foydalangan holda va model parametrlari optimallashtiriladi bashorat qilingan ehtimollar va haqiqiy belgilar o'rtasidagi farqni minimallashtirish.

Boshqa tomondan, Softmax regressiyasi ko'p sinfli sinflashtirish algoritmidir maqsadli o'zgaruvchi ikkitadan ortiq mumkin bo'lgan natijalarga ega bo'lganda. U ehtimollikni modellashtiradi kirishga softmax funksiyasini o'rnatish orqali har bir mumkin bo'lgan sinfga tegishli kirishning Xususiyatlari. Softmax funktsiyasi a ni chiqaradigan logistik funktsiyaning kengaytmasidir barcha mumkin bo'lgan sinflar bo'yicha ehtimollik taqsimoti. Softmax regressiyasi ham o'qitilishi mumkin
maksimal ehtimollikni baholashdan foydalangan holda va model parametrlari optimallashtiriladi bashorat qilingan ehtimollar va haqiqiy belgilar o'rtasidagi farqni minimallashtirish.

Logistik va softmax regressiyasi ham sinflashtirish vazifalari uchun mashhur algoritmlardir ularning soddaligi, samaradorligi va tushunarliligi uchun. Ular turli sohalarda keng qo'llaniladi tasvir tasnifi, tabiiy tilni qayta ishlash va hissiyot kabi ilovalar tahlil. Biroq, ular murakkab yoki yuqori chiziqli bo'lmagan ma'lumotlarda yaxshi ishlamasligi mumkin va xususiyatlari muhandislik yoki neyron tarmoqlar kabi murakkabroq modellarni talab qilishi mumkin yuqori aniqlikka erishish.
Ishlashni baholash mashinani o'rganishda muhim qadam bo'lib, u baholashni o'z ichiga oladi o'qitilgan modelning aniqligi va umumlashtirish qobiliyati. Bir necha usullar mavjud mashinani o'rganish modelining ishlashini baholash uchun, shu jumladan:
1. O'quv va test to'plamlari: Ushbu yondashuvda mavjud ma'lumotlar to'plami ikki qismga bo'linadi: a o'quv to'plami va test to'plami. Model o'quv majmuasi va uning ishlashi bo'yicha o'qitiladi test majmuasida baholanadi. Ushbu usulning afzalligi shundaki, u o'lchovni ta'minlaydi model ko'rinmas ma'lumotlarga qanchalik yaxshi umumlashtirilganligi.
2. O'zaro tekshirish: o'zaro tekshirish - bu qiymatni baholash uchun ishlatiladigan qayta namuna olish usuli modelning ishlashi. Bu ma'lumotlar to'plamini k kichik to'plamga bo'lish va o'qitishni o'z ichiga oladi model k marta, har safar test to'plami va qolganlari sifatida boshqa kichik to'plamdan foydalaniladi quyi to'plamlar o'quv to'plami sifatida. Keyin ishlash k iteratsiya bo'yicha o'rtacha hisoblanadi. Ushbu usul ma'lumotlar to'plami kichik bo'lsa va ishonchliroq taxminni taqdim etganda foydalidir modelning ishlashi haqida.
3. tartibsizlik matritsasi: tartibsizlik matritsasi - bu ish faoliyatini umumlashtiruvchi jadval bashorat qilingan teglarni haqiqiy teglar bilan solishtirish orqali tasniflash modeli.
4. ROC egri chizig'i va AUC balli: ROC (Qabul qiluvchining ishlash xarakteristikasi) egri chizig'i haqiqiy ijobiy stavkaning (TPR) noto'g'ri musbat ko'rsatkichga (FPR) nisbatan syujeti tasniflash chegaralari. AUC (egri chiziq ostidagi maydon) balli bitta raqamdan iborat barcha mumkin bo'lgan tasniflash chegaralarida modelning ishlashini umumlashtiradi. Bu usul odatda ikkilik tasniflash muammolari uchun ishlatiladi.
5. Aniqlik-eslab qolish egri chizig'i: Aniqlik-eslash egri chizig'i aniqlik va eslab qolishning syujetidir turli tasniflash chegaralari. Bu modelning ko'proq ma'lumotli o'lchovini beradi muvozanatsiz ma'lumotlar to'plamlari uchun ishlash.
Tegishli baholash usulini tanlash o'ziga xos xususiyatlarga bog'liq ma'lumotlar to'plami va mavjud muammo. Savdolarni diqqat bilan ko'rib chiqish muhimdir turli usullar o'rtasida va olish uchun bir nechta baholash ko'rsatkichlaridan foydalanish modelning ishlashini har tomonlama tushunish.

Mashinani o'rganishda tartibsizlik matritsasi

Mashinani o'rganishda tartibsizlik matritsasi a ning ishlashini umumlashtiruvchi jadvaldir bashorat qilingan teglarni haqiqiy teglar bilan solishtirish orqali sinflashtirish modeli. Buning bir usuli tasniflash natijalarini tasavvur qiling va model qanchalik yaxshi ishlashini tushuning. Tartibsizlik matritsasi to'rtta qiymatdan iborat: haqiqiy ijobiy (TP), noto'g'ri musbat (FP), haqiqiy salbiy (TN) va noto'g'ri salbiy (FN). Bu qiymatlar quyidagilarga asoslanadi ta'riflar:
Haqiqiy ijobiy (TP): Model ijobiy sinfni to'g'ri bashorat qiladi.
Noto‘g‘ri musbat (FP): Haqiqiy sinf bo‘lganda model ijobiy sinfni bashorat qiladi salbiy.
Haqiqiy salbiy (TN): Model salbiy sinfni to'g'ri bashorat qiladi.
False Negative (FN): Model haqiqiy sinf bo'lganda salbiy sinfni bashorat qiladi ijobiy.
tartibsizlik matritsasi odatda jadval formatida taqdim etiladi, bu erda haqiqiy sinf belgilari mavjud qatorlarda, bashorat qilingan sinf belgilari esa ustunlarda keltirilgan. Matritsadan turli xil ishlash ko'rsatkichlarini hisoblash uchun foydalanish mumkin, masalan, aniqlik, aniqlik, eslab qolish. Ikkilik sinflashtirish muammosi uchun tartibsizlik matritsasiga misol:

Ushbu tartibsizlik matritsasidan foydalanib, biz turli xil ishlash ko'rsatkichlarini quyidagicha hisoblashimiz mumkin:
Aniqlik: (TP + TN) / (TP + FP + TN + FN)
Aniqlik: TP / (TP + FP)
Eslab qoling: TP / (TP + FN)
F1 balli: 2 * Aniqlik * Eslab qolish / (Aniqlik + Qayta chaqirish)
tartibsizlik matritsasi tasniflash samaradorligini baholash uchun foydali vositadir model, ayniqsa sinflarning taqsimlanishi bo'lmagan nomutanosib ma'lumotlar to'plamlari uchun forma. U modelning tasnifini aniq va aniq ifodalaydi natijalar va modelni yaxshilash kerak bo'lgan sohalarni aniqlashga yordam beradi.
MNIST ma'lumotlar bazasi (O'zgartirilgan Milliy standartlar va texnologiyalar institutining qisqartmasi) qo'lda yozilgan raqamlar namunalarining to'liq ma'lumotlar bazasidir. Maʼlumotlar bazasi AQSh Milliy standartlar va texnologiyalar instituti tomonidan birinchi navbatda neyron tarmoqlarga asoslangan mashinani oʻrganishdan foydalangan holda tasvirni aniqlash usullarini kalibrlash va solishtirish maqsadida taklif qilingan standartdir. Ma'lumotlar oldindan tayyorlangan misol tasvirlaridan iborat bo'lib, ular asosida tizimlar o'qitiladi va sinovdan o'tkaziladi[3][4]. Ma'lumotlar bazasi NIST 20x20 pikselli qora va oq namunalarning asl to'plamini qayta ishlashdan so'ng yaratilgan. NIST ma'lumotlar bazasini yaratuvchilar, o'z navbatida, AQSh aholini ro'yxatga olish byurosining namunalari to'plamidan foydalanganlar, ularga amerikalik universitet talabalari tomonidan yozilgan ko'proq test namunalari qo'shilgan . NIST to'plamidan olingan namunalar normallashtirildi, antialiased qilindi va 28x28 pikselli kulrang rangdagi tasvirga qisqartirildi.

MNIST ma'lumotlar bazasida o'qitish uchun 60 000 ta rasm va sinov uchun 10 000 ta rasm mavjud[6]. O'quv va sinov namunalarining yarmi NIST o'quv to'plamidan, qolgan yarmi esa NIST test to'plamidan edi.



MNIST ma'lumotlar bazasida o'qitilgandan so'ng minimal xatolikka erishish uchun ko'plab urinishlar bo'lgan va ilmiy adabiyotlarda muhokama qilingan. Rekord natijalar konvolyutsion neyron tarmoqlardan foydalanish bo'yicha nashrlarda ko'rsatilgan, xatolik darajasi 0,23% gacha ko'tarilgan. Ma'lumotlar bazasini yaratuvchilarning o'zlari bir nechta sinov usullarini taqdim etdilar . Asl ish shuni ko'rsatadiki, qo'llab-quvvatlovchi vektor mashinasidan foydalanish 0,8% xato darajasiga erishishi mumkin. U ikkita asosiy kichik to'plamga bo'lingan: 60 000 ta o'quv to'plami tasvirlar va 10 000 ta rasmdan iborat test to'plami. Trening to'plami modelni o'rgatish uchun ishlatiladi, test to'plami esa modelning ishlashini baholash uchun ishlatiladi.
MNIST ma'lumotlar to'plamidagi har bir namunaning tuzilishi quyidagicha: Har bir tasvir 28x28 o‘lchamdagi kulrang shkala piksel qiymatlari matritsasi sifatida taqdim etiladi, bunda har biri piksel qiymati 0 dan 255 gacha bo'lgan butun sondir. Har bir rasm bilan bog‘langan yorliq 0 dan 9 gacha bo‘lgan bitta butun son qiymatidan iborat, tasvir ko'rsatadigan raqamni ko'rsatadi.
MNIST ma'lumotlar to'plami tasvirni aniqlash va tasniflash vazifalari uchun keng qo'llaniladi va unga juda ko'p turli xil algoritmlar, shu jumladan chuqur neyron tarmoqlari, qo'llab-quvvatlash vektor mashinalari, qaror daraxtlari va k-eng yaqin qo'shnilar. Ma'lumotlar to'plami mavjud yangi algoritmlarning ish faoliyatini baholash uchun standart etalonga aylanadi mashinani o'rganish va kompyuterni ko'rish sohasi.
Xulosa
Xulosa qilib aytganda, mashinali o’qitish - bu sun'iy intellekt sohasidagi ajoyib yutuq. Garchi bu haqda o'ylaganingizda daxshatli oqibatlarga olib keladigan bo'lsa-da, ushbu mashinali o'qitish ilovalari ushbu texnologiya bizning hayotimizni yaxshilashga yordam beradigan ko'plab usullardir.


Foydalanilgan adabiyotlar:

  1. http://www.machinelearning.ru/wiki/index.php?title=MachineLearning:%D0%9A%D0%BE%D0%BD%D1%86%D0%B5%D0%BF%D1%86%D0%B8%D1%8F_%D1%80%D0%B5%D1%81%D1%83%D1%80%D1%81%D0%B0

  2. https://data-flair.training/blogs/machine-learning-applications/

  3. https://data-flair.training/blogs/machine-learning-tutorial/

Download 274.51 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling