M. A. Kamenskaya
Ma'lumotlarni qazib olish
Download 0.6 Mb.
|
portal
- Bu sahifa navigatsiya:
- Bilimlarni kashf qilish ( Knowledge Discovery )
1.9.10. Ma'lumotlarni qazib olish
Sun'iy Intel lekte fanining"ma'lumotlarni qazib olish"deb nomlangan bo'limi faol rivojlanmoqda. Sun'iy intellekt tizimlarining odatiy yo'nalishi — ekspert tizimlari bilan taqqoslaganda uning o'ziga xos xususiyatlari qanday (1.9.8 ga qarang)? Ekspert tizimi cheklangan xarakterga ega, unda mutaxassis odam dastlab ma'lum bilimlarni qo'yadi, ular "sizunga kirasiz", undan "olinadi". Bilimlar bazasini to'ldirish-axborot va intellektual o'rtasidagi chegara. Ekspert intellektual tizimlarini rivojlantirishning dastlabki bosqichidanazariyotchilar vaishlab chiquvchilar bilimlarni nurlantirish muammosini kog-nitologning amaliy soha mutaxassisi bilan suhbati orqali muvaffaqiyatli hal qilish mumkinligiga ishonishdi. Biroq, endi taniqli bo'lgan paradoks paydo bo'ldi:mutaxassisning malakasi qanchalik yuqori bo'lsa, u o'z mulohazalarini shunchalik kam tushuntirishga qodir (bu holda kognitiv jarayon og'zaki darajadan intuitiv darajaga o'tadi). Ma'lumotlarni qazib olish tizimiga kelsak, u bilan ishlash jarayonida порождается yangi bilimlarpaydo bo'ladi, ular unga kiritilmagan. Yondashuv quyidagicha: agar amaliy sohadagi mutaxassis qaror qabul qilishda o'z fikrlarini bayon qila olmasa, unda pyuter dasturlari u uchun buni qilishga harakat qilsin. Mutaxassisdan faqat ma'lumotlarto'plami ko'rinishidagi namunalarni namoyish qilish talab qilinadi, ularga ekspertning natijalari "bog'langan" (o'quv namunasi). Shunday qilib, so ma'lumotlarini qazib olishning asosiy g'oyasishundan iboratki, tartibsiz va norasmiy ravishda berilganusullardan turli xil rasmiy usullar yordamida (ba'zialgoritmlardan foydalangan holda ushbu ma'lumotlarniqayta ishlash) aniq shaklda olish mumkin.ushbu usullarni qo'llashdan oldin berilgan massivda yashiringan bilimlar[53]. Bilimlarni kashf qilish (Knowledge Discovery) : Ingliz tilidagi adabiyotlarda intellektual analizom ma'lumotlari bilan bog'liq «holda "ma'lumotlar bazalarida bilimlarni kashf etish" atamasi tez in databases» — tez ishlatiladi-ma'lumotlar bazalarida bilimlarni aniqlash, bu ma'lumotlar bazalarida tovar, yangi, potentsial foydali va yaxshi tushunilgan naqshlarni (naqshlarni, namunalarni) aniqlashning har qanday ahamiyatsiz jarayonini anglatadi. Ushbu jarayonning bosqichlarini qisqacha sanab o'tamiz: "xom" ma'lumotlarni to'plash, tanlash, ostidapishirish, ma'lumotlarni o'zgartirish, berilgan naqshlarni qidirish, qonuniy ravishda topilgan o'lchovlarni baholash, umumlashtirish vatuzish. 1970-yillarning oxirida "data mining"atamasi paydo bo'ldi. U "qazib olish", "qazish", "ma'lumotlarni olish" deb tarjima qilingan [19, 20]. Zamonaviy talqinda ma'lumotlarni olish ma'lumotlarbazalarida bilimlarni kashf etish ("knowledge discovery in databases") bosqichi sifatida tushuniladi, u mavjud ma'lumotlar bazasi yoki ma'lumotlar omboridan olingan naqshlarni yaratish uchun o'ziga xos algoritmlarni qo'llashdan iborat. Ba'zan adabiyotda "data mining" va "knowledge discovery in databases" tushunchalarisinonim sifatida uchrashadi. Ma'lumotlar bazasi yoki ma'lumotlar ombori (ma'lumotlar ombori) — inboshqa tizimlardan, ham operatsion, ham meros qilib olingan ma'lumotlarning yorliqli drayveri. Turli xil omborlar quyidagi umumiy xususiyatlarga ega. Ma'lumotlar ma'lum bir faoliyat sohasida ishlatiladigan asosiy tushunchalar atrofida birlashtirilgan. Ma'lumotlar xatolardan tozalanadi, yig'iladi vaoxirgi foydalanuvchi tushunadigan shaklda taqdim etiladi. Saqlashni yaratish jarayoni iterativdir: VRE menem bilan saqlash arxitekturasifoydalanuvchilarning javoblariga va tegishliusullar bilan aniqlangan raqamlarning qonunlariga qarab o'zgaradi. Shunday qilib, omborda to'plangan ma'lumotlar mavzuga yo'naltirilganligi, yaxlitligi, xrono-logiyani qo'llab-quvvatlashi va o'zgarmasligi bilan ajralib turadi. Ma'lumotlar bazalarida bilimlarni aniqlash jarayonining asosiy bosqichlari [53] quyidagilar: 1) kompyuter tizimining oxirgi foydalanuvchisining maqsadlarini amalga oshirish uchun domen va tegishli bilimlarni tanlash; 2) ma'lumotlarning asl to'plamini tanlash (factov bazasi) va o'zgaruvchilar uchun zarur bo'lgan kichik to'plamlar. faktlar bazasidan yangi bilimlarni jalb qilish; 3) ma'lumotlar bazasini takomillashtirish va oldindan ishlov berish:"shovqin" ni kamaytirishga yordam beradigan ma'lumotlar bo'yicha asosiy operatsiyalarni tanlash; 4) berilgan qisqartirish: ma'lumotlarning foydali xususiyatlarini aniqlash, shundama'lumotlarning taqdimoti bilimlarni aniqlash maqsadiga mos keladigan muammolarni hal qilish uchun etarli bo'ladi; 5) ma'lumotlarni olish muammosini aniqlash, ya'ni. bilimlarni aniqlash jarayonining tasnifi sifatida spetsifikatsiyasi, klasterlash va boshqalar; 6)berilgan naqshlarni (naqshlarni) qidirish uchun ma'lumotlarni olishniamalga oshiradigan algoritmlarni tanlash. Ushbu tanlov modellar va parametrlar bilan mos kelishi kerakmi ma'lumotlarni taqdim etish; 7) ma'lumotlarni olish jarayoni: foydalanuvchi uchun qiziqarli shaklda naqshlarni (naqshlarni)qidirish (tasniflash va klasterlashning asosiy shakllari, regressiya, Reshedaraxtlari va boshqalar); 8)bosqichlarni takrorlash mumkin bo'lgan naqshlarni baholash, umumlashtirish va tuzish 1-7 keyingi takrorlash uchun. Shunday qilib, bilimlarni aniqlash jarayoni ma'lumotlarni olish algoritmlaridan (data mining) foydalanishdir. Zarur ishlov berish, faktlar bazasidan namunalarni shakllantirish va uning ba'zi o'zgarishlarini hisobga olgan holda natijalarni qabul qilishning shakllantirilgan mezonlariga muvofiq faktlar bazalaridan ba'zi naqshlarni (naqshlarni, namunalarni) ajratib ko'rsatish [53]. Download 0.6 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling