Va ularni olish usullari


Download 122.22 Kb.
bet13/16
Sana18.10.2023
Hajmi122.22 Kb.
#1708987
1   ...   8   9   10   11   12   13   14   15   16
Bog'liq
Reja m a’lumotlar va bilimlar. Asosiy tushunchalar-fayllar.org

Knowledge Discovery in Databases (KDD - ma’lumotlar bazasidan
bilimlarni ajratib olish)-bu berilgan struktura yoki bog’lanishlarda yashiringan
ma’lumotlarni topish maqsadida ma’lumotlarni avtomatik tahlil qilish vositalarini
qo'llash yordamida inson tamonidan katta hajmdagi ma’lumotlarni tadqiq
qilishning analitik jarayoni. Yashiringan struktura yoki bog’lanishlar xarakteri
haqida tasavvurlar to'liq yoki qisman yo'q deb faraz qilinadi. KDD dastlabki
fikrlash va to'liq bo'lmagan masala bayoni, ma’lumotlarni avtomatlashtirilgan
tahlil uchun mos holatga keltirish va ularni dastlabki qayta ishlash, ma’lumotlarni
avtomatik tadqiq qilish vositalari (Data mining) yashiringan struktura yoki
bog’lanishlarni topish, topilgan modellarni ma’lumotlarni modellarini qurish va
foydalanilmagan yangi modellarda sinovdan o'tkazish va topilgan modellarning
inson tamonidan tavsiflanishidir.
Data mining (ma’lumotlarni qidirib topish) - xom ma’lumotlardan
-
oldindan ma’lum bo'lmagan;
-
trivial bo'lmagan;
-
amaliy foydali;
93



-
inson tamonidan tavsiflash uchun kerak bo'lgan yashirincha struktura


yoki bog’lanishlarni ”Mashina” algoritmalari, sun’iy intellekt vositalari yordamida
tadqiq etish va topishdan iborat [23, 24].
KDD texnologiyasi muammolarni yechish uchun mo'ljallangan. KDD - bu
sun’iy intellekt, sonli matematik usullar, statistik va evristik yondashuvlarning eng
so'ngi yutuqlarini o'zida mujassamlashtirgan sintetik soha. Bu texnalogiyaning
maqsadi-ma’lumotlar omboridan oddiy usullar bilan topib bo'lmaydigan
yashiringan model va munosabatlarni topishdan iborat. Mashina zimmasiga
nafaqat “chalkash” amallar (Masalan, farazning statistic ahamiyatini tekshirish)
balki, avval chalkash deb qabul qilinmagan amallar (yangi farazni ishlab chiqish)
yuklanadi. KDD avval hatto tadqiqotchi xayoliga kelmagan, ularni qo'llash ham,
alohida mijozni davolash ham, butun tibbiy muassasa faoliyati samaradorligini
oshirishga imkon beruvchi ma’lumotlar orasidan o'zaro munosabatlarni ko'rishga
imkon beradi.
Modelni qurish tadqiq etilayotgan hodisa xarakteristikalari orasidagi
miqdoriy bog’lanishni o'rnatishga imkon beradi. Model xarita kabi reallikning
abstrakt ifodasidir. Xarita airaportdan uyga yo'lni ko'rsatish mumkin, lekin u
to'siq tufayli sodir bo'lgan to'qnashuvni yoki hozirgi paytda amalga oshirilayotgan
ta’mirlash ishlarini va aylanish talab etilishini ko'rsata olmaydi. Model mavjud real
munosabatlarga mos kelmagancha muvaffaqqiyatli natijalarga erishib bo'lmaydi.
Ikki xil modellar mavjud: bashoratli va tavsiflovchi. Birinchisi boshqa ma’lumotlar
majmuasi uchun oshkora natijalarni bashoratlaydigan modelni qurish uchun
ma’lum natijaga ega biror ma’lumotlar majmuasidan foydalanadi. Ikkinchisi esa
mavjud ma’lumotlardagi bog’lanishlarni tavsiflaydi. Bu modellar boshqaruv
qarorlarini qabul qilish uchun foydalaniladi.
Albatta tajribali shifokor o'z mijozalari davolash uchun ko'pgina
modellardan xabardor, uzoq muddat davomida kuzatilayotgan kasalliklar va
turlicha ko'rsatkichlarning bog’lanishlari haqida ma’lumotlarga ega. KDD
texnologiyalari nafaqat emperik tadqiqotlarni tasdiqlashi, balki bu texnalogiya
yordamida oldin ma’lum bo'lmagan yangi modellarni qurish mumkin. Ajratilgan
model absalyut bilimga davogarlik qilolmasa ham, analitikka muqobil statistik
modelning o'zining ustunligi bilan ham bir qadar afzallik beradi. Hatto haqiqatdan
topilgan o'zaro aloqa sababiy bo'lish yoki bo'lmasligi to'risida o'ylashga turtki
bo'lishi, bu esa hodisani guruhlashtirishga va uni yaxshi tushunishga imkon beradi.
Lekin modellar jamlanmasi, agar ularni ko'rsatkichlari bo'yicha turli guruhlarga va
har bir muhit bo'yicha birlashtirsak, tibbiy xizmatni tashkil etishda jiddiy afzallik
beradi. Bundan tashqari, hammavaqt nol bo'lmagan ehtimol mavjud, bu esa KDD
usullari yordamida keyingi tahlili yoki ilmiy kashfiyoti, yoki ommoviy tibbiy
xizmat ko'rsatishni tashkil etishni yaxshilashga olib keladigan model tuzushga
muvoffiq bo'ladi.
KDD ning real sistemalarga nisbatan eng muhim maqsadi - bu jarayonlar
mohiyatini tushunishni yaxshilash.
Murakkab, lekin hali o'rganilmagan
sistemalarga nisbatan optimal yechim tushunchasi ma’lum xususiyatga ega. Barcha
masalalar uchun ham “Ideal” tushunishga erishishga intilish ma’noga ega emas.
94



Masalan, biznesda optimal yechim deb hamisha vaqt va resurs cheklashlariga mos


tanlav tushuniladi. Hozirda esa odamlar boshqa odamlarga nisbatan biror yaxshi
narsa qilishga intiladilar. Shunday qilib, agar biz kishi tasavvuruga eng yuqori
darajada optimal yechimlarni izlash uchun KDD usullaridan foydalanishni istasak,
u holda imtiyozlarni aniqlashtirish zarur. Ya’ni murakkab sistemalarda “Ideal”
optimumga erishish uchun boshqa sistemalar bilan taqqoslash yo'li bilan
aniqlanadigan doimiy yaxshilash usuliga nisbatan kamroq ahamiyatli bo'lib qolishi
mumkin.
KDD - bu faqat tahlik vositalari jamlanmasi, lekin barcha hayotiy vaziyatlar
uchun vosita emas. KDD ma’lumotlarning o'zini ham, qo'llanilgan usullar
asoslarini tadqiqotchi tamonidan bilish va tushunish zarurligini e’tiborga oladi. Bu
vositalar jamlanmasi faqat ma’lumotlardan modellar va munosabatlarni topishda
analitiklarga yordam berishi mumkin. Topilgan model turli ko'rsatkichlarining
o'zaro bog’lanishi ba’zi ko'rsatkichlarning oddiy statistik korrelyatsiyasi kabi
modelning o'z - o'ziga o'zaro bog’lanishi haqida dalolat bera olmaydi. Har bir
model odamlar tamonidan tahlil qilinishi kerak va real hayotda tekshirilishi lozim.
KDD jihozlari odatda foydalanuvchidan yashirin va uni foydalanilayotgan
usullarni qo'llashdagi murakkablik va nozikliklarni oshkora bilishdan saqlasada, u
foydalanuvchidan tashuvchi jixozlar va algoritmlar ishlash asoslarini tushunishni
talab etadi.
KDD texnologiya shifokor - tahlilchi yoki menejerlarning o'rnini bosa
olmaydi. Ularga o'zlari boshqaradigan ish sifatini yaxshilash uchun zamonaviy,
qudratli vositani beradi. Albatta, ma’lumotlar omborida yangi bilimni topish
texnologiyasi tadqiqotchi qo'yilgan savollarga javob beradi.
KDD va OLAP [23, 24]. M a’lumotlarni qayta ishlash bilan shuullanadigan
odamlarda ko'pincha bitta savol uchrab turadi. Bu Data mining va OLAP (On-Line

Download 122.22 Kb.

Do'stlaringiz bilan baham:
1   ...   8   9   10   11   12   13   14   15   16




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling