Koshti Data Mining
Download 96,48 Kb.
|
Koshti Data Mining-fayllar.org
Paklin N. B., Gorishkov V. I. Biznes tahlili: ma'lumotlardan bilimgacha (SD). - Sankt-Peterburg. : Ko'rinish. Piter, 2009. - 624 p.
Posilannya
Wikimedia fondi. 2010 yil. OLAP-tizimlari analitikaga ma'lumotlarni tahlil qilishda gipotezalarni qayta ko'rib chiqish imkoniyatini beradi, shuning uchun analitikaning asosiy vazifasi sizning bilimingiz va dalillaringizga asoslangan gipotezalarni yaratishdir. . Bunday bilimlar ma'lumotga bo'lgan ulug'vor obsesyon tufayli yo'qoladi, chunki odam mustaqil ravishda erisha olmaydi. Cim bilan bog'liq gipotezalarni o'tkazib yuborish imkoniyati mavjud, chunki ular sezilarli foyda keltirishi mumkin. "Biriktirilgan" bilimlarni aniqlash uchun avtomatik tahlilning maxsus usullari ishlab chiqiladi, ulardan amaliy ravishda ma'lumotni "to'sib qo'yish" dan bilim olish mumkin. Buning ortida "ma'lumotlar qazib olish (Data Mining)" yoki "intellektual ma'lumotlarni tahlil qilish" atamasi bevosita o'rnatilgan. U DataMining-ning shaxsiy maqsadiga asoslanadi, chunki u bir-birini to'ldiradi. Harakat o'qi ulardan. DataMining - bu ma'lumotlar bazalarida ahamiyatsiz va amaliy naqshlarni aniqlash jarayoni. (asosiy guruh) DataMining - bu biznes mukammalligiga erishish usuli bilan noma'lum tuzilmalarni (patterslarni) aniqlash uchun ajoyib ma'lumotlar ulanishlarini ko'rish, keyinchalik modellashtirish va modellashtirish jarayoni (SAS instituti) DataMining - butun jarayon, buning metasi - tushunchalarni tanib olishning turli usullaridan saqlangan ma'lumotlarga katta sodiqlik natijasida yangi muhim korrelyatsiyalar, tendentsiyalar belgilarini aniqlash, shuningdek, statistik va matematikani ishlab chiqish. usullar (GartnerGroup) Ma'lumotni qazib olish - bu "mashina" (algoritmlar, qismli razvedka) tomonidan ushbu ma'lumotlardan olingan bilimlarning namoyon bo'lishining natijasidir.Raqamlar ilgari ma'lum bo'lmagan, ahamiyatsiz, amaliy, jo'shqin, talqin qilish mumkin ediodamlar. (A. Bargesyan "Ma'lumotlarni tahlil qilish texnologiyalari") DataMining - bu biznes haqidagi asosiy bilimlarni ochib berish jarayoni. Dominion ular paydo bo'lishini biladi Keling, rasmiylar nima ko'rsatayotganini bilib olaylik.
DataMining-da bilimlarning namoyishi namuna sifatida xizmat qiladi. Modellarning yaratilish yo'llarida yotganini ko'ring. Eng kengaytirilganlari: qoidalar, qarorlar daraxtlari, klasterlar va matematik funktsiyalar. DataMining rahbari Faraz qilaylik, qonun bo'lgan shablon tushunchasi DataMining texnologiyasining asosi hisoblanadi. Urush orqali, tsikhning paydo bo'lishi, prihovaniya vyd uzluksiz ko'z qonuniyatlari, DataMining vazifalari buzilmoqda. Shaklda namoyon bo'lishi mumkin bo'lgan har xil turdagi qonuniyatlar, aqlli odamlar DataMining asosiy vazifalarini ifodalaydi. DataMining-ni qanday kuzatish haqida yagona fikr yo'q. Ko'pgina nufuzli dzherellar shunday ta'mirlanadi: tasnifi, klasterlash, prognozlash, assotsiatsiya, vizualizatsiya, tahlil va namoyon bo'lish ko'rib chiqish, baholash, qo'ng'iroqlarni tahlil qilish, xulosalarni qayta ishlash. Quyida keltirilgan meta tavsifi DataMining vazifalari haqida ko'proq ma'lumot berish, ularni taqqoslash, shuningdek, ushbu vazifalar buzilgan usullarni taqdim etishdir. DataMining-ning eng keng qamrovli vazifasi tasniflash, klasterlashtirish, assotsiatsiya, prognozlash va vizualizatsiyadir. Ushbu darajada vazifa vibratsiyalangan ma'lumotlar turlari, DataMining vazifalarining eng muhim tasnifi bilan belgilanadi. Tasniflash Shaxssiz narsalarni sindirish vazifasi guruhlarning, sinflarning darajalarining apriori topshiriqlari bilan qo'riqlanadi, bunday hidlardan terining o'rtasi birma-bir o'xshash bo'lib, ular taxminan bir xil kuch va belgilar bo'lishi mumkin. Asosan tashqariga chiqishga qaror qilganingizda tahlil atribut qiymati (belgi). Tasniflash eng muhim vazifalardan biri sifatida ma'lumotlar qazib olish . Von zastosovuetsya ichida marketing tayinlangan talabnoma beruvchilarning kreditga layoqatliligini baholashda mijozlarning sadoqati, tasvirlarni tan olish , tibbiy diagnostika va boshqa boy qo'shimchalar. Teri sinfi ob'ektlarining kuchi bo'yicha tahlilchi sifatida, agar birinchi sinfga yangi ogohlantirish kiritilsa, kuch qiymatlari avtomatik ravishda yangisiga o'tadi. Sinflar soni ikkita bilan cheklanganligi sababli, bo'lishi mumkinikkilik tasnifi Ular boy katlanmış binolar bo'lishi mumkin darajada. Masalan, kredit xavfining "Yuqori", "O'rta" yoki "Past" kabi bosqichlarini tayinlash bo'yicha o'rinbosari, siz faqat ikkitasini yutib olishingiz mumkin - "Ko'rish" yoki "Past". DataMining-da tasniflash uchun anonim modellar tanlanadi: neyron tarmoqlari, yechim daraxtlari , qo'llab-quvvatlash vektor mashinalari, k-yaqin yig'indilar usuli, qoplash va in algoritmlari.o'zgarish(sinfni belgilang ) Terini parvarish qilish uchun tayinlangan. Rasmiy ravishda tasniflash bo'linish asosida amalga oshiriladiochiq joy belgisi sohada, terining oraliq joylaridaboy vektorlar ular bir xilga o'xshaydi. Boshqacha qilib aytadigan bo'lsak, qo'shiqchilik sinfi bilan bog'liq bo'lgan hududda juda ko'p joy egallagan ob'ekt sifatida vinolar yangigacha yotadi. Klasterlash Qisqa Tasvir. G'oyalarni mantiqiy davom ettirish uchun klasterlash tasnifi. Vazifa murakkabroq, klasterlashning o'ziga xos xususiyati shundaki, boshning orqa qismidagi narsalarni tasniflaydiganlar aqlli emaslar. Klasterlash natijasi ob'ektlarni guruhlarga bo'lishdir. Klasterlash vazifalarini ishlab chiqish usuliga misol: "o'qituvchisiz" o'rgatish maxsus turdagi neyron tarmoqlar - Kohonenning o'z-o'zini tashkil etuvchi xaritalari. Uyushmalar Qisqa Tasvir. Assotsiativ qoidalarni izlash natijasida ma'lumotlar to'plamining bir-biriga mos keladigan podiaslari o'rtasida qonuniyatlar mavjud. Vídminníst sotsíatsíí víd dvíd dvíh priedníní vdan DataMining: qonuniyatlarni izlash tahlil qilinadigan ob'ektning kuchiga emas, balki bir vaqtning o'zida sodir bo'ladigan ko'p sonli bo'linmalarga asoslanadi. Assotsiativ qoidalarga asoslangan masalalarni yechishning eng katta algoritmi Apriori algoritmidir. Ketma-ket yoki ketma-ket assotsiatsiya Qisqa Tasvir. Ketma-ketlik sizga tranzaktsiyalar orasidagi soat naqshlarini bilish imkonini beradi. Vorislik vazifasi assotsiatsiyaga o'xshaydi, lekin men bir vaqtning o'zida oldinga siljishlar o'rtasida emas, balki soatda paydo bo'ladigan podia o'rtasida (soatda kuylash oralig'ida sodir bo'ladigan tobto) qonuniyatlarni o'rnatish usulidan foydalanaman. Boshqacha qilib aytganda, ketma-ketlik kunning soatiga bog'langan lansetning yuqori imovirnistyu bilan ifodalanadi. Aslida, assotsiatsiya nolga teng bo'lgan vaqt oralig'i bilan bosqichma-bosqich ketma-ketlik deb ataladi. DataMining vazifalari ketma-ket naqsh vazifalari deb ataladi. Ketma-ketlik qoidasi: X oxirgi soatga tushgandan keyin Y paydo bo'ladi. dumba. Aholining 60 foizi kvartira sotib olgach, ikki kunga muzlatgich, 50 foizi esa ikki oyga televizor sotib oladi. Vazifaning yakuniy maqsadi marketing va menejmentda keng ko'rinadi, masalan, mijozlarga xizmat ko'rsatish siklini boshqarish (CustomerLifecycleManagement). Regressiya, prognozlash (prognozlash) Qisqa Tasvir. Natijada, tarixiy ma'lumotlarning o'ziga xos xususiyatlari asosida bashorat qilish vazifasining farqi asosiy raqamli ko'rsatkichlarning qoldirilishi yoki mumkin bo'lgan qiymatlari bilan baholanadi. Bunday vazifalarni hal qilish uchun usullar va matematik statistika, nerv o'lchovlari va boshqa usullar keng qo'llaniladi. Qo'shimcha vazifa Download 96,48 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling