Mavzu : Ma'lumotlarni qidirish kontseptsiyasi. Ma'lumotlarni qidirish usullari va bosqichlari Reja
Download 169.29 Kb.
|
3-MI
- Bu sahifa navigatsiya:
- Data Mining nima
- ASOSIY XULOSALAR
Mavzu : Ma'lumotlarni qidirish kontseptsiyasi. Ma'lumotlarni qidirish usullari va bosqichlari Reja : Data Mining nima ? Ma'lumotlarni qidirish kontseptsiyasi. Ma’lumotlar to’plami. Ma'lumotlarni qidirish usullari va bosqichlari. Data Mining nima?Ma'lumotlarni qazib olish - bu xom ma'lumotlarni foydali ma'lumotlarga aylantirish uchun kompaniyalar tomonidan qo'llaniladigan jarayon. Katta hajmdagi ma'lumotlarning namunalarini izlash uchun dasturiy ta'minotdan foydalangan holda, korxonalar yanada samarali marketing strategiyalarini ishlab chiqish, sotishni ko'paytirish va xarajatlarni kamaytirish uchun o'z mijozlari haqida ko'proq ma'lumot olishlari mumkin. Ma'lumotlarni qidirish samarali ma'lumotlarni yig'ish , saqlash va kompyuterda qayta ishlashga bog'liq. ASOSIY XULOSALARMa'lumotni qazib olish - bu tendentsiyalar va naqshlarni aniqlash uchun katta miqdordagi ma'lumotlarni tahlil qilish jarayoni. Korporatsiyalar maʼlumotlarni qidirishdan mijozlar nimani qiziqtirayotgani yoki sotib olmoqchi boʻlgan narsalarni oʻrganishdan tortib, firibgarlikni aniqlash va spamni filtrlashgacha boʻlgan barcha maqsadlarda foydalanishi mumkin. Ma'lumotlarni qidirish dasturlari foydalanuvchilar so'ragan yoki taqdim etgan ma'lumotlar asosida ma'lumotlardagi naqsh va ulanishlarni buzadi. Ijtimoiy media kompaniyalari foyda olish uchun o'z foydalanuvchilarini sotish uchun ma'lumotlarni qidirish usullaridan foydalanadilar. So'nggi paytlarda ma'lumotlarni qidirishdan bunday foydalanish tanqid ostiga olindi, chunki foydalanuvchilar ko'pincha shaxsiy ma'lumotlari bilan sodir bo'layotgan ma'lumotlarni bilishmaydi, ayniqsa ular afzal ko'rishga ta'sir qilish uchun foydalanilganda. Har qanday zamonaviy korxonaning korporativ ma'lumotlar bazasida odatda ma'lum faktlar yoki ob'ektlar (masalan, tovarlar, ularning sotilishi, mijozlari, hisoblari) to'g'risidagi yozuvlarni saqlaydigan jadvallar to'plami mavjud. Qoida tariqasida, bunday jadvaldagi har bir yozuv ba'zi bir aniq ob'ekt yoki faktlarni tavsiflaydi. Masalan, sotish jadvalidagi yozuv falon xaridorga falon menejer tomonidan falon mahsulot sotilganligi va umuman bu ma'lumotdan boshqa hech narsani o'z ichiga olmaydi. Biroq, bir necha yillar davomida to'plangan ko'p sonli bunday yozuvlar yig'indisi qo'shimcha, ancha qimmatli ma'lumotlarning manbai bo'lib qolishi mumkin, ularni bitta aniq yozuv asosida olish mumkin emas, ya'ni har qanday ma'lumot o'rtasidagi naqsh, tendentsiya yoki o'zaro bog'liqlik haqidagi ma'lumotlar. Bunday ma'lumotlarga misol sifatida, ma'lum bir mahsulotni sotish haftaning kuniga, kunning vaqtiga yoki yilning vaqtiga bog'liqligi, xaridorlarning qaysi toifalari u yoki bu mahsulotni ko'proq sotib olishlari, ma'lum bir mahsulotni xaridorlarning qaysi qismi bilan bog'liqligi haqidagi ma'lumotlar. xaridorlarning qaysi toifasi ko'pincha berilgan kreditni o'z vaqtida to'lamaydigan boshqa o'ziga xos mahsulotni sotib oladi. Bunday ma'lumot odatda prognozlash, strategik rejalashtirish, tavakkalchilikni tahlil qilishda ishlatiladi va uning korxona uchun qiymati juda yuqori. Ko'rinib turibdiki, shuning uchun ham uni qidirish jarayoni Data Mining deb nomlangan (ingliz tilidan qazib olish "qazib olish" degan ma'noni anglatadi va ulkan faktik ma'lumotlar to'plamidan naqsh qidirish haqiqatan ham shunga o'xshash). Ma'lumotlarni qidirish atamasi ma'lum bir texnologiyani emas, balki turli xil matematik va statistik algoritmlar yordamida korrelyatsiyalarni, tendentsiyalarni, munosabatlar va naqshlarni qidirish jarayonini bildiradi: klasterlash, sub-namuna olish, regressiya va korrelyatsion tahlil. Ushbu qidiruvning maqsadi ma'lumotlarni biznes jarayonlarini aniq aks ettiradigan shaklda taqdim etish, shuningdek, biznesni rejalashtirish uchun muhim bo'lgan jarayonlarni (masalan, ma'lum tovarlarga talab dinamikasi yoki xizmatlar yoki ularni sotib olish xaridorning har qanday xususiyatlariga bog'liqligi). E'tibor bering, uzoq vaqt davomida ma'lumotlarni tahlil qilishning asosiy vositasi bo'lib kelgan an'anaviy matematik statistika, shuningdek, biz bir necha bor yozgan onlayn -tahliliy ishlov berish (OLAP) vositalari (bu mavzu bo'yicha materiallarni bizning kompakt -diskda ko'ring). har doim bunday muammolarni hal qilishda muvaffaqiyatli qo'llaniladi. Odatda, statistik usullar va OLAP oldindan tuzilgan farazlarni tekshirish uchun ishlatiladi. Biroq, ko'pincha qarorlarni qabul qilish uchun biznes-tahlilni amalga oshirishda ko'pincha gipotezani shakllantirish eng qiyin vazifa bo'lib chiqadi, chunki ma'lumotlarning barcha naqshlari bir qarashda aniq ko'rinmaydi. Zamonaviy Data Mining texnologiyasi ma'lumotlar namunalariga xos bo'lgan naqshlarni aks ettiruvchi andozalar kontseptsiyasiga asoslangan. Naqshlarni qidirish ushbu quyi namunalar haqida hech qanday apriori taxminlardan foydalanmaydigan usullar bilan amalga oshiriladi. Agar statistik tahlilda yoki OLAPni qo'llashda, "bu xizmat mijozlari tomonidan to'lanmagan fakturalarning o'rtacha soni qancha?" Kabi savollar ... Shu bilan birga, bu marketing siyosati va mijozlar bilan ishlashni tashkil etishga ahamiyatsiz yondashuvni ta'minlaydigan ikkinchi savolga javobdir. Data Mining-ning muhim xususiyati-bu izlanayotgan naqshlarning nostandart va aniq emasligi. Boshqacha qilib aytganda, Data Mining vositalari statistik ma'lumotlarni qayta ishlash vositalari va OLAP vositalaridan farqi shundaki, ular foydalanuvchilar tomonidan qabul qilingan o'zaro bog'liqliklarni oldindan tekshirish o'rniga, ular mavjud ma'lumotlarga asoslanib, bunday o'zaro bog'liqliklarni topa oladilar va ular haqida gipotezalar tuzadilar. tabiat Shuni ta'kidlash kerakki, Data Mining vositalaridan foydalanish statistik vositalar va OLAP vositalaridan foydalanishni istisno qilmaydi, chunki ikkinchisi yordamida ma'lumotlarni qayta ishlash natijalari, qoida tariqasida, ma'lumotlarning mohiyatini yaxshiroq tushunishga yordam beradi. izlash kerak bo'lgan naqshlar.
DATA MINING UCHUN DASTLABKI MA'LUMOTLAR Ma'lumotlar yig'ilishidan foydalanish, agar to'g'ri mo'ljallangan ma'lumotlar omborida etarlicha katta hajmdagi ma'lumotlar mavjud bo'lsa, oqlanadi (aslida ma'lumotlar omborlari odatda qarorlarni qo'llab -quvvatlash bilan bog'liq muammolarni tahlil qilish va bashorat qilish uchun yaratilgan). Shuningdek, biz ma'lumotlar omborlarini qurish tamoyillari haqida bir necha bor yozganmiz; tegishli materiallarni bizning CD-ROMimizda topish mumkin, shuning uchun biz bu masala ustida to'xtalmaymiz. Eslatib o'tamiz, ombordagi ma'lumotlar - bu butun korxona uchun bir xil bo'lgan va o'z faoliyati tasvirini istalgan vaqtda tiklashga imkon beradigan to'ldirilgan to'plam. Shuni ham yodda tutingki, do'konning ma'lumotlar tuzilmasi shunday tuzilganki, unga so'rovlar iloji boricha samarali bajariladi. Biroq, ma'lumotlar omborlarida emas, balki OLAP kublarida, ya'ni oldindan qayta ishlangan statistik ma'lumotlar to'plamlarida naqsh, korrelyatsiya va tendentsiyalarni qidira oladigan Data Mining vositalari mavjud.
DATA MINING USULLARI YORDAMIDA ANIQLANGAN NAQSH TURLARI V.A. Dyukning so'zlariga ko'ra, Data Mining usullari bilan aniqlangan beshta standart naqsh turlari mavjud: Assotsiatsiya - voqealarning bir -biri bilan bog'lanish ehtimoli yuqori (masalan, ko'pincha bitta mahsulot boshqasi bilan birga sotib olinadi); Ketma -ketlik - o'z vaqtida bog'liq bo'lgan voqealar zanjirining yuqori ehtimoli (masalan, bitta mahsulotni sotib olgandan keyin ma'lum vaqt ichida boshqasi yuqori ehtimollik bilan sotib olinadi); Tasniflash - u yoki bu hodisa yoki ob'ekt tegishli bo'lgan guruhni tavsiflovchi belgilar mavjud (odatda, ba'zi qoidalar allaqachon tasniflangan hodisalarni tahlil qilish asosida tuziladi); Klasterlash - bu tasnifga o'xshash va undan farqli o'laroq, guruhlarning o'zi bir vaqtning o'zida ko'rsatilmagan - ular ma'lumotlarni qayta ishlash jarayonida avtomatik ravishda aniqlanadi; Vaqtinchalik naqshlar - bashorat qilish uchun ishlatiladigan ma'lum ma'lumotlarning xatti -harakatlar dinamikasida naqshlarning mavjudligi (odatiy misol - ayrim tovarlar yoki xizmatlarga talabning mavsumiy o'zgarishi). Ma'lumotlar to'plami – bu nima? Bu alohida elementlardan tarkib topgan, vositalar to'plami xususiyatiga ega bo'lgan, avtomatlashtirilgan tizimlarning inson aralashuvisiz bunday elementlarni identifikatsiya qilish, talqin etish va qayta ishlash imkonini beruvchi davlat organlarining tizimlashtirilgan bir ko'rinishdagi ma'lumotlaridir Download 169.29 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling