4- маъруза doc


 Ma’lumotlarni tayyorlash


Download 96.76 Kb.
Pdf ko'rish
bet3/6
Sana06.11.2023
Hajmi96.76 Kb.
#1750111
1   2   3   4   5   6
Bog'liq
4- маъруза

3. Ma’lumotlarni tayyorlash
Bosqich maqsadi: Data Mining uchun ma’lumotlar bazasini ishlab chiqish
Data Mining jarayonini barcha sifatli natijalar olishga to’g’ri kelsa ham,
ma’lumotlar tayyorlash muhim bosqichlarda bo’ladi.
Bundan tashqari, tushuniladiki, ma’lumotlarni tayyorlash bosqichida, loyiha
asosida ,bir qancha baholash bo’yicha butun vaqtning 80 % i sarflanishi mumkin.
Bu bosqichni to’liq ko’ramiz:
3.1. Ma’lumotlarga aniqlash va tahlil qilish talablari.
Bu o’rganiladigan savollar ortidan foydalanuvchilar taqsimlash (geografik,
tashkiliy, funksional); ma’lumotlarga ruxsat berish so’rovlari, tahlil qilish uchun
kerakli, zaruriy tashqi va ichki ma’lum oylar manbalari; shuningdek, analitik
xarakteristik sistemalar (ma’lumotlarni o’lchash, chiqadigan dokumentlarning
asosiy ko’rinishlari, axborot va boshqalarni mantiqiy ravishda o’zgartirish).
4. Ma’lumotlarni to’plash
Ma’lumotlar saqlanadigan joyni tashkil qilishda soddaroq va samaraliroq
tahlil qilinadi, undan foydalanish, sarflash nuqtayi nazaridan, alohida ma’lumotlar
bazasi va ma’lumotlar vitrinasidan foydalaniladi.
Shuningdek, Data Mining uchun yetakchi axborotlashgan tizimdan, tashqi
manbalardan, qog’oz tarqatuvchilardan, shu bilan birga ekspert bilimidan yoki
so’rov natijalaridan axborotlar kerak bo’lishi mumkin.
Bu bosqichda bir qancha ma’lumotlarni kodlash bajariladi.
4.1. Kerakli ma’lumotlar sonini aniqlash
Kerakli ma’lumotlar sonini aniqlash davomida bu ma’lumotlar yaxshimi yoki
yo’qligi nazarga olinadi.
Agar ma’lumotlar yaxshilangan va biz vaqtincha qatorda ishqilsak, maqsadga
muvofiq
bilinadiki, shunday
ma’lumotlar
to’plami
mavsumiy
aylanuvchi
komponentlarni o’z ichiga oladi. Ma’lumotlarni mavsumiy aylanuvchi komponentlari
ishtirokida bitta mavsum aylanishi ortida minimum kerakli ma’lumotlarga ega
bo’linadi.
Agar ma’lumotlar yaxshilanmasa, vaqtinchalik ma’lumotlarni to’plashda
erkinlik hodisasi bo’lmaganda, ma’lumotlarni yig’ishda quyidagi qoidaga amal
qilinadi.
To’plamda qaydlar soni. Yetarli bo’lmagan ma’lumotlar to’plamida qaydlar
soni, noto’g’ri modellarni qurish sabablarini keltirishi mumkin.
Statistika nuqtayi nazari bilan, aniq modellar tegishli ma’lumotlar soni ortishi
bilan ko’payadi. Mumkinki, bir qancha ma’lumotlar eskirgan yoki qandaydir tipik
bo’lmagan holda tavsiflangan bo’ladi, va ma’lumotlar bazasidan ularni o’chirish
kerak. Ma’lumotlarni yig’ish bo’lishi mumkin bo’lgan katta holatlarni ifodalaydi.



Download 96.76 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling