- Tasniflash va prognozlash muammolarini hal qilish uchun ko'pgina Data Mining usullari qo'llaniladi. Bular, masalan, chiziqli regressiya, neyron tarmoqlar, qaror daraxtlari (ba'zan ularni bashorat qilish va tasniflash daraxtlari deb atashadi). Tasniflash va prognozlash muammolari o'xshash va farqlarga ega.
- Prognozlash uchun asos vaqt bazalari shaklida saqlanadigan tarixiy ma'lumotlardir. Time-Series Data Mining tushunchasi mavjud. Vaqt ketma-ketligi ko'rinishidagi retrospektiv ma'lumotlarga asoslanib, turli xil Data Mining vazifalarini hal qilish mumkin.
- 6.2.1.-Shaklda Data Mining vaqt seriyalari bo'yicha so'rov natijalari keltirilgan. Ko'rinib turibdiki, prognozlash yechilayotgan vazifalar orasida eng katta foizni (23%) egallaydi. Keyin tasniflash va klasterlash (har biri 14%), segmentatsiya va anomaliyani aniqlash (har biri 9%), qoidalarni aniqlash (8%). Boshqa vazifalar har birida 6% dan kamroqni tashkil qiladi.
Bu yerda vaqt ketma-ketligi va oddiy izlanishlar orasidagi ikkita tub farq bor: - Vaqt seriyasining a'zolari, tasodifiy tanlanganlar a'zolaridan farqli o'laroq, statistik jihatdan mustaqil bo`lmaydi.
- Vaqt seriyalari a'zolari teng taqsimlanmagan.
Vaqt seriyalarining odatiy misoli - bu birja savdolari ma'lumotlari. Korxonaning turli xil ma'lumotlar bazalarida to'plangan ma'lumotlar xronologik tartibda tuzilgan va ketma-ket keladigan nuqtalarda ishlab chiqarilgan bo'lsa, vaqt qatori hisoblanadi. Vaqt seriyasini tahlil qilish quyidagi maqsadlarda o'tkaziladi: - Vaqt seriyasining asosiy tarkibiy qismlari tendentsiya va mavsumiy tarkibiy qismdir. Ushbu turkumlarning tarkibiy qismlari tendentsiyani yoki mavsumiy tarkibiy qismni namoyish qilishi mumkin. Vaqt o'zgarishi mumkin bo'lgan vaqt ketma-ketligining tizimli tarkibiy qismi.
- Trend - bu vaqt ketma-ketligiga ta'sir qiladigan umumiy yoki uzoq muddatli tendentsiyalar ta'siri ostida shakllanadigan tasodifiy bo'lmagan funksiya. Masalan, o'rganilayotgan bozorning o'sish omili tendentsiyaga misol bo'lishi mumkin. Vaqt seriyasidagi tendentsiyalarni aniqlashning avtomatik usuli yo'q. Ammo vaqt ketma-ketligi monotonik tendentsiyani o'z ichiga olgan bo'lsa (ya'ni, uning doimiy ravishda ko'payishi yoki barqaror pasayishi qayd etilsa), ko'p hollarda vaqt ketma-ketligini tahlil qilish qiyin emas.
- Prognozlash muammolarining turli xil formulalari mavjud bo'lib, ularni ikki guruhga bo'lish mumkin: bitta seriyali bashorat qilish va ko'p seriyali bashorat qilish yoki o'zaro ta'sir ko'rsatuvchi seriya
Do'stlaringiz bilan baham: |