Kompyuter injinering fakulteti


Download 101.1 Kb.
bet2/4
Sana31.01.2024
Hajmi101.1 Kb.
#1829588
1   2   3   4
Bog'liq
klassifikatsiya

Umumiy tushunchalar
Sinflashtirish jarayonining maqsadi - bashoratli atributlarni kirish parametrlari sifatida qabul qiladigan va bog'liq atributning qiymatini oladigan modelni yaratish. Sinflashtirish jarayoni ob'ektlar to'plamini ma'lum bir mezon bo'yicha sinflarga bo'lishdan iborat.
Klassifikator - bu ob'ektning oldindan belgilangan sinflarning qaysi biriga tegishli ekanligini xususiyatlar vektori asosida aniqlaydigan muayyan ob'ekt.
Matematik usullardan foydalangan holda Sinflashtirishni amalga oshirish uchun matematik Sinflashtirish apparati yordamida boshqarilishi mumkin bo'lgan ob'ektning rasmiy tavsifiga ega bo'lish kerak. Bizning holatda, bu tavsif ma'lumotlar bazasi hisoblanadi. Har bir ob'ekt (ma'lumotlar bazasi yozuvi) ob'ektning ba'zi xususiyatlari haqida ma'lumotni o'z ichiga oladi. Manba ma'lumotlar to'plami (yoki ma'lumotlar namunasi) ikkita to'plamga bo'linadi: o'qitish va sinov.
Trening to'plami - modelni o'rgatish (konstruktsiya qilish) uchun foydalaniladigan ma'lumotlarni o'z ichiga olgan to'plam. Bunday to'plam misollarning kirish va chiqish (maqsad) qiymatlarini o'z ichiga oladi. Chiqish qiymatlari modelni o'rgatish uchun mo'ljallangan. Sinov to'plami, shuningdek, misollarning kirish va chiqish qiymatlarini o'z ichiga oladi. Bu erda chiqish qiymatlari modelning ishlashini tekshirish uchun ishlatiladi.
Sinflashtirish jarayoni ikki bosqichdan iborat: modelni qurish va undan foydalanish.
1. Model qurilishi (oldindan belgilangan sinflar to'plamining tavsifi):
a) har bir misol ma'lumotlar to'plami bitta oldindan belgilangan sinfga tegishli;
b) bu ​​bosqichda o'quv majmuasidan foydalaniladi va model tuziladi;
c) olingan model Sinflashtirish qoidalari, qarorlar daraxti yoki matematik formula bilan ifodalanadi.
2. Modeldan foydalanish (yangi yoki noma'lum qiymatlarni Sinflashtirish):
a) modelning to'g'riligini (aniqligini) baholash:
- test misolidagi ma'lum qiymatlar olingan modeldan foydalanish natijalari bilan taqqoslanadi;
- aniqlik darajasi - test to'plamidagi to'g'ri tasniflangan misollar foizi;
- test to'plami, ya'ni. tuzilgan model sinovdan o'tkaziladigan to'plam o'quv majmuasiga bog'liq bo'lmasligi kerak.
b) agar modelning aniqligi maqbul bo'lsa, sinfi noma'lum bo'lgan yangi misollarni Sinflashtirish uchun modeldan foydalanish mumkin.
Sinflashtirish jarayoni, ya'ni modelni qurish va undan foydalanish 2 va 3-rasmlarda keltirilgan.

2-Rasm. Sinflashtirish jarayoni. Model qurilishi.

3-Rasm. Sinflashtirish jarayoni. Modeldan foydalanish.

Sinflashtirish uchun turli usullar qo'llaniladi:


- qarorlar daraxtlari yordamida Sinflashtirish;
- Bayes (sodda) tasnifi;
- sun'iy neyron tarmoqlar yordamida Sinflashtirish;
- qo'llab-quvvatlovchi vektorli mashinalar yordamida Sinflashtirish;
- statistik usullar, xususan, chiziqli regressiya;
- eng yaqin qo'shni usuli yordamida Sinflashtirish;
- CBR usuli yordamida Sinflashtirish;
- genetik algoritmlar yordamida Sinflashtirish.
Ba'zi usullardan foydalangan holda Sinflashtirish muammosining sxematik yechimi (chiziqli regressiya, qarorlar daraxtlari va neyron tarmoqlardan foydalanish) rasmda ko'rsatilgan. (4, 5, 6-rasm)

4-Rasm. Chiziqli regressiya yordamida Sinflashtirish masalasini yechish.

5-Rasm. Qaror daraxti usuli yordamida Sinflashtirish masalasini hal qilish

6-Rasm. Neyron tarmoq usuli yordamida Sinflashtirish masalasini yechish
Sinflashtirishning aniqligini o'zaro tekshirish yordamida baholash mumkin. O'zaro tekshirish - test to'plamidan olingan ma'lumotlar bo'yicha Sinflashtirish to'g'riligini baholash protsedurasi bo'lib, u o'zaro tekshirish to'plami deb ham ataladi. Sinov to'plamining Sinflashtirish aniqligi o'quv majmuasining Sinflashtirish aniqligi bilan taqqoslanadi. Agar testlar to'plamining tasnifi o'quv majmuasining tasnifi bilan taxminan bir xil aniqlik natijalarini bersa, model o'zaro tekshirishdan o'tgan deb hisoblanadi. O'quv va test majmualariga bo'linish namunani ma'lum bir nisbatda bo'lish yo'li bilan amalga oshiriladi, masalan, o'quv majmuasi ma'lumotlarning uchdan ikki qismini va test majmuasi ma'lumotlarning uchdan bir qismini tashkil qiladi. Ushbu usul ko'p sonli misollar uchun qo'llanilishi kerak. Namuna hajmi kichik bo'lsa, maxsus usullardan foydalanish tavsiya etiladi, bunda o'quv va sinov namunalari qisman bir-biriga mos kelishi mumkin.
Usullar quyidagi xususiyatlar asosida baholanishi kerak:
- tezlik
- mustahkamlik
- izohlash
- ishonchlilik
Tezlik model yaratish va undan foydalanish uchun ketadigan vaqtni tavsiflaydi. Barqarorlik, ya'ni. boshlang'ich binolarning har qanday buzilishiga qarshilik shovqinli ma'lumotlar va ma'lumotlardagi etishmayotgan qiymatlar bilan ishlash qobiliyatini anglatadi. Interpretability modelning tahlilchi tomonidan tushunilishini ta'minlaydi. Sinflashtirish usullarining ishonchliligi ushbu usullarning ma'lumotlar to'plamida shovqin va chegaralar mavjudligida ishlashini talab qiladi.

Download 101.1 Kb.

Do'stlaringiz bilan baham:
1   2   3   4




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling