Reja: m a’lumotlar va bilimlar. Asosiy tushunchalar
Download 0.65 Mb. Pdf ko'rish
|
Knowledge Discovery in Databases (KDD - ma’lumotlar bazasidan
bilimlarni ajratib olish)-bu berilgan struktura yoki bog’lanishlarda yashiringan ma’lumotlarni topish maqsadida ma’lumotlarni avtomatik tahlil qilish vositalarini qo'llash yordamida inson tamonidan katta hajmdagi ma’lumotlarni tadqiq qilishning analitik jarayoni. Yashiringan struktura yoki bog’lanishlar xarakteri haqida tasavvurlar to'liq yoki qisman yo'q deb faraz qilinadi. KDD dastlabki fikrlash va to'liq bo'lmagan masala bayoni, ma’lumotlarni avtomatlashtirilgan tahlil uchun mos holatga keltirish va ularni dastlabki qayta ishlash, ma’lumotlarni avtomatik tadqiq qilish vositalari (Data mining) yashiringan struktura yoki bog’lanishlarni topish, topilgan modellarni ma’lumotlarni modellarini qurish va foydalanilmagan yangi modellarda sinovdan o'tkazish va topilgan modellarning inson tamonidan tavsiflanishidir. Data mining (ma’lumotlarni qidirib topish) - xom ma’lumotlardan - oldindan ma’lum bo'lmagan; - trivial bo'lmagan; - amaliy foydali; 93 - inson tamonidan tavsiflash uchun kerak bo'lgan yashirincha struktura yoki bog’lanishlarni ”Mashina” algoritmalari, sun’iy intellekt vositalari yordamida tadqiq etish va topishdan iborat [23, 24]. KDD texnologiyasi muammolarni yechish uchun mo'ljallangan. KDD - bu sun’iy intellekt, sonli matematik usullar, statistik va evristik yondashuvlarning eng so'ngi yutuqlarini o'zida mujassamlashtirgan sintetik soha. Bu texnalogiyaning maqsadi-ma’lumotlar omboridan oddiy usullar bilan topib bo'lmaydigan yashiringan model va munosabatlarni topishdan iborat. Mashina zimmasiga nafaqat “chalkash” amallar (Masalan, farazning statistic ahamiyatini tekshirish) balki, avval chalkash deb qabul qilinmagan amallar (yangi farazni ishlab chiqish) yuklanadi. KDD avval hatto tadqiqotchi xayoliga kelmagan, ularni qo'llash ham, alohida mijozni davolash ham, butun tibbiy muassasa faoliyati samaradorligini oshirishga imkon beruvchi ma’lumotlar orasidan o'zaro munosabatlarni ko'rishga imkon beradi. Modelni qurish tadqiq etilayotgan hodisa xarakteristikalari orasidagi miqdoriy bog’lanishni o'rnatishga imkon beradi. Model xarita kabi reallikning abstrakt ifodasidir. Xarita airaportdan uyga yo'lni ko'rsatish mumkin, lekin u to'siq tufayli sodir bo'lgan to'qnashuvni yoki hozirgi paytda amalga oshirilayotgan ta’mirlash ishlarini va aylanish talab etilishini ko'rsata olmaydi. Model mavjud real munosabatlarga mos kelmagancha muvaffaqqiyatli natijalarga erishib bo'lmaydi. Ikki xil modellar mavjud: bashoratli va tavsiflovchi. Birinchisi boshqa ma’lumotlar majmuasi uchun oshkora natijalarni bashoratlaydigan modelni qurish uchun ma’lum natijaga ega biror ma’lumotlar majmuasidan foydalanadi. Ikkinchisi esa mavjud ma’lumotlardagi bog’lanishlarni tavsiflaydi. Bu modellar boshqaruv qarorlarini qabul qilish uchun foydalaniladi. Albatta tajribali shifokor o'z mijozalari davolash uchun ko'pgina modellardan xabardor, uzoq muddat davomida kuzatilayotgan kasalliklar va turlicha ko'rsatkichlarning bog’lanishlari haqida ma’lumotlarga ega. KDD texnologiyalari nafaqat emperik tadqiqotlarni tasdiqlashi, balki bu texnalogiya yordamida oldin ma’lum bo'lmagan yangi modellarni qurish mumkin. Ajratilgan model absalyut bilimga davogarlik qilolmasa ham, analitikka muqobil statistik modelning o'zining ustunligi bilan ham bir qadar afzallik beradi. Hatto haqiqatdan topilgan o'zaro aloqa sababiy bo'lish yoki bo'lmasligi to'risida o'ylashga turtki bo'lishi, bu esa hodisani guruhlashtirishga va uni yaxshi tushunishga imkon beradi. Lekin modellar jamlanmasi, agar ularni ko'rsatkichlari bo'yicha turli guruhlarga va har bir muhit bo'yicha birlashtirsak, tibbiy xizmatni tashkil etishda jiddiy afzallik beradi. Bundan tashqari, hammavaqt nol bo'lmagan ehtimol mavjud, bu esa KDD usullari yordamida keyingi tahlili yoki ilmiy kashfiyoti, yoki ommoviy tibbiy xizmat ko'rsatishni tashkil etishni yaxshilashga olib keladigan model tuzushga muvoffiq bo'ladi. KDD ning real sistemalarga nisbatan eng muhim maqsadi - bu jarayonlar mohiyatini tushunishni yaxshilash. Murakkab, lekin hali o'rganilmagan sistemalarga nisbatan optimal yechim tushunchasi ma’lum xususiyatga ega. Barcha masalalar uchun ham “Ideal” tushunishga erishishga intilish ma’noga ega emas. 94 Masalan, biznesda optimal yechim deb hamisha vaqt va resurs cheklashlariga mos tanlav tushuniladi. Hozirda esa odamlar boshqa odamlarga nisbatan biror yaxshi narsa qilishga intiladilar. Shunday qilib, agar biz kishi tasavvuruga eng yuqori darajada optimal yechimlarni izlash uchun KDD usullaridan foydalanishni istasak, u holda imtiyozlarni aniqlashtirish zarur. Ya’ni murakkab sistemalarda “Ideal” optimumga erishish uchun boshqa sistemalar bilan taqqoslash yo'li bilan aniqlanadigan doimiy yaxshilash usuliga nisbatan kamroq ahamiyatli bo'lib qolishi mumkin. KDD - bu faqat tahlik vositalari jamlanmasi, lekin barcha hayotiy vaziyatlar uchun vosita emas. KDD ma’lumotlarning o'zini ham, qo'llanilgan usullar asoslarini tadqiqotchi tamonidan bilish va tushunish zarurligini e’tiborga oladi. Bu vositalar jamlanmasi faqat ma’lumotlardan modellar va munosabatlarni topishda analitiklarga yordam berishi mumkin. Topilgan model turli ko'rsatkichlarining o'zaro bog’lanishi ba’zi ko'rsatkichlarning oddiy statistik korrelyatsiyasi kabi modelning o'z - o'ziga o'zaro bog’lanishi haqida dalolat bera olmaydi. Har bir model odamlar tamonidan tahlil qilinishi kerak va real hayotda tekshirilishi lozim. KDD jihozlari odatda foydalanuvchidan yashirin va uni foydalanilayotgan usullarni qo'llashdagi murakkablik va nozikliklarni oshkora bilishdan saqlasada, u foydalanuvchidan tashuvchi jixozlar va algoritmlar ishlash asoslarini tushunishni talab etadi. KDD texnologiya shifokor - tahlilchi yoki menejerlarning o'rnini bosa olmaydi. Ularga o'zlari boshqaradigan ish sifatini yaxshilash uchun zamonaviy, qudratli vositani beradi. Albatta, ma’lumotlar omborida yangi bilimni topish texnologiyasi tadqiqotchi qo'yilgan savollarga javob beradi. KDD va OLAP [23, 24]. M a’lumotlarni qayta ishlash bilan shuullanadigan odamlarda ko'pincha bitta savol uchrab turadi. Bu Data mining va OLAP (On-Line Download 0.65 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling