Mavzu – 5: Sinflash masalasini yechish. Bayes klassifikatsiyasi Tasniflash(klassifikaciya) vazifasi


Download 17.78 Kb.
bet1/2
Sana07.10.2023
Hajmi17.78 Kb.
#1694691
  1   2
Bog'liq
Mavzu-5 (1)


Mavzu – 5:Sinflash masalasini yechish. Bayes klassifikatsiyasi
Tasniflash(klassifikaciya) vazifasi
Tasniflash eng sodda va ayni paytda eng ko'p hal qilinadigan Data Mining vazifasidir. Tasniflash vazifalarining keng tarqalganligini hisobga olib, ushbu kontseptsiyaning mohiyatini aniq tushunish kerak.
Bu erda bir nechta ta'riflar mavjud.
Tasniflash-o'rganilayotgan ob'ektlar, hodisalar, jarayonlarning jinsi, turlari, turlari bo'yicha, ularni o'rganish qulayligi uchun har qanday muhim xususiyatlarga ko'ra tizimli taqsimlanishi; dastlabki tushunchalarni guruhlash va ularning ushbu o'xshashlik darajasini aks ettiruvchi ma'lum tartibda joylashishi.
Tasniflash-ushbu ob'ektlar orasidagi o'xshashlik yoki farqni aniqlash uchun tanlangan o'xshash tasniflash xususiyatlariga (bir yoki bir nechta xususiyatlarga) ega bo'lgan ba'zi bir printsip bo'yicha tartiblangan ob'ektlar to'plami.
Tasniflash quyidagi qoidalarga rioya qilishni talab qiladi:
* har bir bo'linish aktida faqat bitta asos qo'llanilishi kerak;
* bo'linish mutanosib bo'lishi kerak, ya'ni. tur tushunchalarining umumiy hajmi bo'linadigan umumiy tushuncha hajmiga teng bo'lishi kerak;
* bo'linish a'zolari bir-birlarini, ularning hajmlarini o'zaro istisno qilishlari kerak
kesib o'tmaslik kerak;
* bo'linish izchil bo'lishi kerak. Ajratish:
* yordamchi (sun'iy) tasniflash, bu tashqi asosda amalga oshiriladi va ko'plab ob'ektlarni (jarayonlar, hodisalar) kerakli tartibni berishga xizmat qiladi;
* ob'ektlar va hodisalarning ichki umumiyligini tavsiflovchi muhim xususiyatlar bo'yicha amalga oshiriladigan tabiiy tasnif.
Ikkinchisi ilmiy tadqiqotning natijasi va muhim vositasidir, chunki tasniflangan ob'ektlarning qonuniyatlarini o'rganish natijalarini taxmin qiladi va birlashtiradi.
Tanlangan xususiyatlarga, ularning kombinatsiyasiga va tushunchalarni ajratish tartibiga qarab tasniflash bo'lishi mumkin:
* oddiy-umumiy tushunchani faqat asosda va barcha turlarni oshkor qilishdan oldin faqat bir marta bo'lish. Bunday tasnifga misol sifatida dixotomiya keltirilgan bo'lib, unda bo'linish a'zolari faqat ikkita tushunchaga ega bo'lib, ularning har biri boshqasiga zid keladi (ya'ni "a va a emas"tamoyiliga amal qilinadi).;
* murakkab-bitta tushunchani turli asoslarga bo'lish va bunday oddiy bo'linishlarni bir butunga sintez qilish uchun ishlatiladi. Bunday tasnifga kimyoviy elementlarning davriy tizimi misol bo'la oladi.
Tasniflash deganda biz ob'ektlarni (kuzatuvlar, hodisalar) oldindan ma'lum bo'lgan sinflardan biriga tayinlashni tushunamiz.
Tasniflash-bu ma'lum bir guruhning xususiyatlarini aniqlash to'g'risida xulosa chiqarishga imkon beradigan naqsh. Shunday qilib, tasniflash uchun u yoki bu hodisa yoki ob'ekt tegishli bo'lgan guruhni tavsiflovchi belgilar bo'lishi kerak (odatda, allaqachon tasniflangan hodisalarni tahlil qilish asosida ba'zi qoidalar shakllantiriladi).
Tasniflash nazorat ostida yoki boshqariladigan ta'lim deb ham ataladigan nazorat ostida o'rganish strategiyasini (supervised learning) anglatadi.
Tasniflash muammosi ko'pincha doimiy va/yoki kategorik o'zgaruvchilar namunasi asosida kategorik bog'liq o'zgaruvchini (ya'ni kategoriya bo'lgan qaram o'zgaruvchini) bashorat qilish deb ataladi.
Masalan, kompaniyaning mijozlaridan qaysi biri ma'lum bir mahsulotning potentsial mijozi ekanligini va kim yo'qligini, kompaniya xizmatidan kim foydalanishini va kim foydalanmasligini va hokazolarni taxmin qilish mumkin. ushbu turdagi vazifalar ikkilik tasniflash vazifalariga tegishli bo'lib, ularda qaram o'zgaruvchi faqat ikkita qiymatni qabul qilishi mumkin (masalan, ha yoki yo'q, 0 yoki 1).
Tasniflashning yana bir varianti, agar bog'liq o'zgaruvchi oldindan belgilangan sinflarning bir qatoridan qiymatlarni qabul qilishi mumkin bo'lsa. Masalan, mijoz qaysi avtomobil markasini sotib olishni xohlashini oldindan aytish kerak bo'lganda. Bunday hollarda qaram o'zgaruvchi uchun ko'plab sinflar ko'rib chiqiladi.
Tasniflash bir o'lchovli (bitta belgi bo'yicha) va ko'p o'lchovli (ikki yoki undan ortiq belgilar bo'yicha) bo'lishi mumkin.

Download 17.78 Kb.

Do'stlaringiz bilan baham:
  1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling