Data science jarayonlar. Data Mining texnologiyalari, metodlari va bosqichlari. 2-ma`ruza slide title


Download 1.13 Mb.
Sana31.01.2023
Hajmi1.13 Mb.
#1142154
Bog'liq
2-maruza (2)

Data science jarayonlar. Data Mining texnologiyalari, metodlari va bosqichlari.

2-ma`ruza

SLIDE TITLE


Data science jarayonlar.
1
Data Mining texnologiyalari, metodlari va bosqichlari.
2
Data Mining qoʼllash soxasi.
3

Data science

  • Data science – bu ma'lumotlar haqidagi fan bo'lib, sohalararo ilmiy usulublar, jarayonlar, algoritmlar va tizimlardan tashkil topgan tarkiblangan va tarkiblanmagan bilim va g`oyalarni o`z ichiga oluvchi fandir. Data science - ma'lumotlarni intellectual tahlil qilish, mashinani o'rganish va katta ma'lumotlar (Big data) bilan bog'liqdir.

Data science

  • Data science - bu ma'lumotlar yordamida "haqiqiy dunyo hodisalarini tushunish va tahlil qilish" maqsadida "statistika, ma'lumotlarni tahlil qilish va tegishli texnikalarni birlashtirish" konsepsiyalaridir.
  • U matematika, statistika, informatika va informatika fan bilimlari kontekstida ko'plab sohalardan olingan usullar va nazariyalardan foydalanadi.
  • Turing mukofoti sovrindori Jim Grey Data science fani "to'rtinchi paradigma" (empirik, nazariy, hisoblash va hozirda ma'lumotlarga asoslangan) fan sifatida taqdim etdiladi hamda “barcha fanlardagi hamma narsalar axborot texnologiyalari ta'siri tufayli o'zgarib boradi" va ma`lumotlar oqimining kopayishini organadi – deb ta`kidlaydi.

Data science – ma`lumotlar haqidagi fan

  • Ma`lumotlar haqidagi fan - data science – bazan datalogy - inglizcha so`zlardan olingan.
  • Bu fan raqamli shaklda ma'lumotlarni tahlil qilish, qayta ishlash va taqdim etish muammolarini o'rganadigan informatika sohasidir. Katta hajmli va yuqori darajadagi parallel tarzda ma'lumotlarni qayta ishlash usullarini, statistik usullarni, ma'lumotlarni intellektual qidirish tizimi usullarini va ma'lumotlar bilan ishlash uchun sun'iy intellekt ilovalarini, shuningdek ma'lumotlar bazalarini loyihalash va ishlab chiqish usullarini birlashtiradigan fandir.

Katta ma`lumotlar dunyosida Data science

  • Katta ma`lumotlarni xususiyatlari bazan 3 ta “V” bilan ifodalanadi.
  • Volume – hajm
  • Variety – xilma xillik
  • Velocity – tezlik
  • Data science – bu katta hajimli turli sohalar va jarayonlar, narsalarga doir xilma-xil ma`lumotlarni yuqori tezlikda qayta ishlaydigan fan sohasidir

Data science jarayonlar

  • Data science jarayonlar odatda 6 bosqichda amalga oshiriladi.
  • Data science ni amalga oshirish jarayoni Data science jarayon deb ataladi.
  • Big Data ni tashkil topishi bevosita Data science jarayonlar bilan bog`liq

Data science jarayon
O`rganish maqsadini belgilash
Ma`lumotlarni yig`ish
Ma`lumotlarni tayyorlash
Ma`lumotlarni o`rganish
Ma`lumotlarni modellashtirish
Tasvirlash va avtomatlashtirish

Data Mining texnologiyalari, metodlari va bosqichlari.

  • Data mining – so`zi ma`lumotlarni qazib olish, ma`lumotlarni intellektual tahlil qilish, ma`lumotlarni chuqur tahlil qilish degan ma`nolarni anglatadi. Data mining termini fanga 1989 yilda Gregory Piatetsky-Shapiro tomonidan kiritilgan.

Data Mining

  • Data Mining - inson faoliyatining turli sohalarida qarorlar qabul qilish uchun zarur bo'lgan ma'lumotlarda ilgari noma'lum, ahamiyatsiz, lekin amaliy foydali va foydalanish mumkin bo'lgan bilimlarni, ma`lumotlarni aniqlash usullari, to'plamlari hamda texnologiyalar majmuasidir.

Data Mining vazifalari

  • Data Miningni ma'lumotlarni qidirish usullari bilan hal qilinadigan vazifalari odatda 2 turga bo`linadi:
  • tavsiflash (ing. descriptive)
  • bashoratlash (ing. predictive)

Data Mining vazifalari

  • Data Miningni tavsiflash vazifalari:
  • assotsiatsiya qoidalari yoki pattern (namunalarni) qidirish;
  • ob'ektlarni guruhlash, klaster tahlil qilish;
  • regressiya modelini yaratish.
  • Data Miningni bashoratlash vazifalari:
  • ob'ektlarning tasnifini (oldindan belgilangan sinflar uchun) aniqlash;
  • regressiya tahlili, vaqt qatorlarini tahlil qilish.

Data Mining metodlaridan foydalangan holda muammolarni hal qilishning bir necha bosqichlari

  • Tahlil masalasini qoyish;
  • Ma'lumotlar yig'ish;
  • Ma'lumotlarni tayyorlash (filtrlash, qo'shish, kodlash);
  • Modelni tanlash (ma'lumotlarni tahlil qilish algoritmi);
  • Model parametrlarini va o'rganish algoritmini tanlash;
  • Modelni o'qitish (boshqa model parametrlarini avtomatik qidirish);
  • Ta'lim sifatini tahlil qilish, agar tahlil qoniqarsiz bo'lsa - 5-bandga yoki 4-bandga o'tish;
  • Aniqlangan namunalarni tahlil qilish, agar tahlil qoniqarsiz bo'lsa - 1, 4 yoki 5-bosqichga o'tish.

E`tiboringiz uchun rahmat

I.N.Tojimamatov


Download 1.13 Mb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling