Modul nomi: Katta ma’lumotlar tahliliga kirish (kirish kursi) Kurs haqida


-bob. ASOSIY BIG MA'LUMOTLARNI BOSHQARISH


Download 1.56 Mb.
bet12/74
Sana29.01.2023
Hajmi1.56 Mb.
#1138295
1   ...   8   9   10   11   12   13   14   15   ...   74
Bog'liq
Введение в аналитику больших массивов данных (Вводный курс) (1)

2-bob. ASOSIY BIG MA'LUMOTLARNI BOSHQARISH



  1. Katta ma'lumotlarni boshqarish yondashuvlari



Katta ma'lumotlardan foydalanish axborotni saqlash va qayta ishlash bilan bog'liq muammolarni hal qilishni talab qildi. 2001 yilda Meta guruhidan ( Gartnerning bir qismi) Dag Leyni bunga e'tibor qaratdi .

    • ma'lumotlarni boshqarish muammolarini hal qilish uchun e'tibor qaratilishi kerak bo'lgan uchta yo'nalish aniqlandi : hajm, tezlik va xilma- xillik . Keyinchalik ular tavsiflovchining asosini tashkil etdi 3 V ( VVV ) deb nomlangan katta ma'lumotlar modeli . Keling, ular haqida batafsilroq to'xtalib o'tamiz.



1. Hajmi - hajm.


Katta ma'lumotlar - bu ma'lumotni olish, saqlash va qayta ishlash usullari va texnologiyalarining butun majmuasidir, chunki ma'lumotlar doimiy ravishda o'zgarib turadi: mavjudi yangilanadi, unga yangisi qo'shiladi. Katta hajmdagi ma'lumotlar bilan ishlashda yuzlab kiruvchi ma'lumotlarning potentsial o'sishi tufayli tez gorizontal miqyosga tayyor bo'lish kerak.


2. Tezlik – tezlik.


Ma'lumotlar miqdorining doimiy o'sishi bilan ularni loyiha maqsadlari talab qiladigan tezlikda qayta ishlash muhimdir. Masalan, juda ko'p sonli datchiklar ma'lum bir mamlakat hududida yoki dunyoda seysmik o'zgarishlarni qayd etadi, ulardan olingan ma'lumotlar ma'lumotlar markaziga yuboriladi, u erda olingan ma'lumotlarni qayta ishlash va tahlil qilish amalga oshiriladi.


Qabul qilingan ma'lumotlar, u yoki bu sabablarga ko'ra, masalan, bir necha daqiqa o'rniga bir necha soat davomida qayta ishlansa, u holda

  • Agar ma'lumotlarni qayta ishlagandan so'ng zilzila haqida ma'lumot olinsa, o'z vaqtida profilaktika choralarini ko'rishning iloji bo'lmaydi va ofatning oqibatlari dahshatli bo'ladi.



IDC allaqachon mavjud bo'lgan V parametrlariga yana bitta parametr qo'shgani tasodif emas - Qiymat yoki ma'lumot qiymati. Berilgan misolda, bu qiymat nolga teng edi, chunki u amal qilish muddati davomida foydalanishdan oldin o'z ahamiyatini yo'qotdi - bu ma'lumotlarning foydaliligi. Axborotning ahamiyati uning ishonchliligidadir ( Haqiqiylik ).
21
Ma'lum bo'lishicha, kiruvchi ma'lumotlarni qayta ishlash tezligi juda muhim, aks holda siz ularning qiymatini yo'qotishingiz va allaqachon ahamiyatsiz ma'lumotlarni keyingi tahlilga topshirishingiz yoki natijada ahamiyatsiz ma'lumotlarni taqdim etishingiz mumkin.



  • agar kerak bo'lsa, ma'lumotlarni qayta ishlash tezligi va saqlash oson kengaytirilishi kerak, bu ham Big Data texnologiyasiga 34 kiritilgan .



3. xilma -xillik - xilma-xillik.


Yuqorida ta'kidlanganidek, tuzilgan ma'lumotlar bilan bir qatorda tuzilmagan shaklda keladigan ma'lumotlar ham mavjud. Va u umumiy axborot oqimida ustunlik qiladi (3-rasm).


Guruch. 3. Katta ma’lumotlarning tavsifiy modeli


Katta ma'lumotlardan foydalanishdan oldin qo'yiladigan vazifalardan biri (axborotni saqlashdan ko'ra ko'proq darajada) olingan ma'lumotlar o'rtasida tezkor aloqa o'rnatish va natijada tuzilgan yoki yarim tizimli tahlil qilish uchun mavjud bo'lgan ma'lumotlarni taqdim etishdir.


Darhaqiqat, har qanday ma'lumotlarning tuzilishi darajasidan qat'i nazar, o'rtasidagi bog'lanishni topa olish va muayyan muammoni hal qilish uchun aniq tahlil qilinadigan natijani olish Big Data uchun juda muhimdir .



  1. Katta ma'lumotlar tarixi (Big Data) - 1-qism. 22

V parametrlaridan birining yo'qolishi tufayli ishonchsiz ma'lumotlar olinadi. 35 .


Katta ma'lumotlarni boshqarish bo'yicha ish yo'nalishlari ma'lum printsiplarga asoslanishi kerak .


1   ...   8   9   10   11   12   13   14   15   ...   74




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling