4- маъруза doc
Ma’lumotlarni tayyorlash
Download 96.76 Kb. Pdf ko'rish
|
4- маъруза
- Bu sahifa navigatsiya:
- 3.1. Ma’lumotlarga aniqlash va tahlil qilish talablari.
- 4. Ma’lumotlarni to’plash
- 4.1. Kerakli ma’lumotlar sonini aniqlash
3. Ma’lumotlarni tayyorlash
Bosqich maqsadi: Data Mining uchun ma’lumotlar bazasini ishlab chiqish Data Mining jarayonini barcha sifatli natijalar olishga to’g’ri kelsa ham, ma’lumotlar tayyorlash muhim bosqichlarda bo’ladi. Bundan tashqari, tushuniladiki, ma’lumotlarni tayyorlash bosqichida, loyiha asosida ,bir qancha baholash bo’yicha butun vaqtning 80 % i sarflanishi mumkin. Bu bosqichni to’liq ko’ramiz: 3.1. Ma’lumotlarga aniqlash va tahlil qilish talablari. Bu o’rganiladigan savollar ortidan foydalanuvchilar taqsimlash (geografik, tashkiliy, funksional); ma’lumotlarga ruxsat berish so’rovlari, tahlil qilish uchun kerakli, zaruriy tashqi va ichki ma’lum oylar manbalari; shuningdek, analitik xarakteristik sistemalar (ma’lumotlarni o’lchash, chiqadigan dokumentlarning asosiy ko’rinishlari, axborot va boshqalarni mantiqiy ravishda o’zgartirish). 4. Ma’lumotlarni to’plash Ma’lumotlar saqlanadigan joyni tashkil qilishda soddaroq va samaraliroq tahlil qilinadi, undan foydalanish, sarflash nuqtayi nazaridan, alohida ma’lumotlar bazasi va ma’lumotlar vitrinasidan foydalaniladi. Shuningdek, Data Mining uchun yetakchi axborotlashgan tizimdan, tashqi manbalardan, qog’oz tarqatuvchilardan, shu bilan birga ekspert bilimidan yoki so’rov natijalaridan axborotlar kerak bo’lishi mumkin. Bu bosqichda bir qancha ma’lumotlarni kodlash bajariladi. 4.1. Kerakli ma’lumotlar sonini aniqlash Kerakli ma’lumotlar sonini aniqlash davomida bu ma’lumotlar yaxshimi yoki yo’qligi nazarga olinadi. Agar ma’lumotlar yaxshilangan va biz vaqtincha qatorda ishqilsak, maqsadga muvofiq bilinadiki, shunday ma’lumotlar to’plami mavsumiy aylanuvchi komponentlarni o’z ichiga oladi. Ma’lumotlarni mavsumiy aylanuvchi komponentlari ishtirokida bitta mavsum aylanishi ortida minimum kerakli ma’lumotlarga ega bo’linadi. Agar ma’lumotlar yaxshilanmasa, vaqtinchalik ma’lumotlarni to’plashda erkinlik hodisasi bo’lmaganda, ma’lumotlarni yig’ishda quyidagi qoidaga amal qilinadi. To’plamda qaydlar soni. Yetarli bo’lmagan ma’lumotlar to’plamida qaydlar soni, noto’g’ri modellarni qurish sabablarini keltirishi mumkin. Statistika nuqtayi nazari bilan, aniq modellar tegishli ma’lumotlar soni ortishi bilan ko’payadi. Mumkinki, bir qancha ma’lumotlar eskirgan yoki qandaydir tipik bo’lmagan holda tavsiflangan bo’ladi, va ma’lumotlar bazasidan ularni o’chirish kerak. Ma’lumotlarni yig’ish bo’lishi mumkin bo’lgan katta holatlarni ifodalaydi. |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling