M. A. Kamenskaya
Download 0.6 Mb.
|
portal
Деревья Qaror daraxtlari (qaror daraxtlari). Qaror (xulosa) daraxtlari mashinani o'rganishning klassik yo'nalishlaridan biri bo'lib, ma'lumotlardagi mantiqiy raqamlarni tasvirlashning eng mashhur yondashuvlaridanbiridir. Qaror daraxtlarini qurish algoritmlari Data Mining sinfidagi eng zamonaviy analitik qo'llanmalartomonidan qo'llaniladiData Mining. Masalan служат процедуры, cha1d (chi square Automatic interaction detection), CART (classification and regression trees), ID3 (Interactive Dichotomizer interaktiv dichotomizer) protseduralari.
Daraxt-bu ierarxik tuzilmabo'lib, unda to'dalar tepaliklar komponentlarga, yoylar esa bog'larga to'g'ri keladi. Odatda daraxt tekislikda quyidagicha joylashgan: tepada-butun tizimni yoki bo'ysunish markazini tasvirlaydigan daraxtning ildizi (ierarxiyaning 1-darajasi); bitta gorizontaldan pastda-ildizbilan bevosita bog'liq bo'lgan 2-darajali ponentlar; keyingi gorizontalda-2-darajali komponentlar bilan bog'langan 3-darajali komponentlar- har bir komponentdanfaqat bitta yoy yuqori darajaga ko'tariladi-shuning uchun bunday strukturaning grafigi daraxt deb ataladi. Ushbu daraxtning barglari strukturaning pastki qismlariga mos keladi. Har qanday cho'qqidan kornu gacha bo'lgan yo'l yagona va undagi cho'qqilar ro'yxati bilan belgilanadi. Ob'ekt yoki vaziyatni qaysi sinfga kiritish to'g'risida qaror qabul qilish uchun daraxtning tugunlarida turgan savollarga ildizdan boshlab javob berish kerak. Qaror daraxtlarini qurishtizimiga ijobiy va salbiy misollarnikiritish kiradi, ular bir nechta belgilar qiymatlari bilan to'ldiriladi. Daraxtning barcha tepalari (ildiz va barglardan tashqari) belgilar bilan belgilanadi, revyevlarning qirralaribelgilar qiymatlari bilan belgilanadi (masalan, ikkilik belgilar choyida 0 yoki 1), har bir varaq + yoki-sinf bilan belgilanadi; ildizdan daraxtga olib boradigan yo'lda barcha belgilar qiymatlari bo'lgan misollar ma'lum bir sinfga tegishli, + yoki -. 1 D 3 tizimi kabi yechim daraxtlari variantidaDCLS algoritmi asos CLSbo'ladi [19]. U eng katta tasniflash kuchiga ega bo'lgan o'zgaruvchiga (maydonga) muvofiq o'quv misollarini (ma'lumotlar bazasi yozuvlarini) sinflarga ajratadi. Bunday o'zgaruvchitomonidan ta'kidlangan misollarning harbir kichik to'plami yana eng katta tasniflash usuliga ega bo'lgan o'zgaruvchan o'zgaruvchidan foydalangan holda kichik sinflarga bo'linadi va hokazoностью и т.д. Разбиение заканчивается, когда в подмножестве ока. Jarayon davomida qaror daraxti hosil bo'ladi. Ushbu daraxt bo'ylab yuqoriurdan eng pastgacha harakatlanish yo'llari konjunktsiya zanjirlari ko'rinishidagi mantiqiy qoidalar bilan belgilanadi. Funktsional qiymatlar прироста информации (information daraxtning har bir tepasi uchun ma'lumot o'sishi (ma'lumot gain — IG) yoki negentropiya va daraxt shoxidan yuqorida tanlanmagan har bir belgi uchun hisoblanadi. Algoritmhar qadamda ma'lumot o'sishi bilan eng yuqori ko'rsatkichga ega bo'lgan belgini tanlab, daraxtning vetini ketma-ket uzaytiradi: bu belgi "siz" + " va " - "sinflarining ob'ektlarini "eng ko'p ajratib turadi". Filialning uzayishi qachon to'xtaydikamdan kam tanlangan xususiyat va uning ma'nosi,ilgari tanlangan xususiyatlarning mi qiymatlari bilan birgalikda, misollarni "+" va "- "sinflariga bo'lish orqali aniq tasniflaydi. Ko'pincha protsedura qayta o'qitishni (overfitting) oldini olish uchun oldinroq tugaydioverfitting, ya'ni.olingan hal qiluvchi qoida, o'quvnamunasidagi misollarni aniq tasniflaydigan holatlar,sinov namunalarida ko'plab xatolarga yo'l qo'yadi. Qaror daraxtlarining kamchiliklari shundaki, ular xususiyatlarni ketma-ket ko'rishning sodda printsipini amalga oshiradilar va ma'lumotlarda "eng yaxshi" (eng to'liq va aniq) qoidalarni topa olmaydilar. Download 0.6 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling