Modul nomi: Katta ma’lumotlar tahliliga kirish (kirish kursi) Kurs haqida
Ma'lumotlar omborlarining qiyosiy tavsiflari
Download 1.56 Mb.
|
Введение в аналитику больших массивов данных (Вводный курс) (1)
Ma'lumotlar omborlarining qiyosiy tavsiflari
va operatsion tizimlar
Ma'lumotlar bazalari o'rtasida ma'lumotlarni moslashtirish, birlashtirish va ko'chirish uchun standart jarayonlar va vositalarni tavsiflash uchun ETL (Extract, Transform, Load) atamasi qo'llaniladi - ekstraktsiya, transformatsiya, yuklash. Axborot omborlarini qurish xususiyatlari [Elektron qayta manba]. URL: https://www.osp.ru/os/2003/04/182942 (kirish sanasi: 07/05/2020). 47 Ma'lumotlar omborida bajariladigan odatiy operatsiyalar standart relyatsion ma'lumotlar bazasidagi operatsiyalardan farq qiladi. Ularni tavsiflash uchun "interaktiv analitik ishlov berish" ( OLAP ) atamasi ishlatiladi. OLAP operatsiyalari odatda tarixiy ma'lumotlarni umumlashtirishga qaratilgan va bir nechta manbalardan ma'lumotlarni yig'ishni o'z ichiga oladi. Masalan, qulaylik uchun tabiiy tilda ifodalangan OLAP so'rovi quyidagicha ko'rinishi mumkin: "Hudud va choraklar bo'yicha barcha do'konlar sotuvi to'g'risida hisobot va o'tgan yil hisobotiga nisbatan raqamlardagi farq." Ushbu misol OLAP so'rovining natijasi odatda standart biznes hisobotiga o'xshashligini ko'rsatadi. Aslida, OLAP operatsiyalari foydalanuvchilarga ombordagi ma'lumotlarni qismlarga bo'lish, qismlarga ajratish va aylantirish, shuningdek, uning turli ko'rinishlarini olish imkonini beradi. OLAP operatsiyalari do'kon tepasida qurilgan ma'lumotlar kubi deb ataladigan ma'lumotlar displeyida ishlaydi . Data kubi qat'iy belgilangan, oldindan belgilangan o'lchamlar to'plamiga ega, bu erda har bir o'lchov ma'lumotlarning bir xususiyatini ifodalaydi. Yuqoridagi namunaviy OLAP soʻrovi quyidagi maʼlumotlar kubik oʻlchamlarini talab qiladi: doʻkon boʻyicha sotuvlar, mintaqalar boʻyicha sotuvlar va chorak boʻyicha sotuvlar. OLAP operatsiyalarini bosish vaqtini tezlashtiradi . Bundan tashqari, ma'lumotlar kubining o'lchamlari to'plami OLAP tizimida oldindan dasturlashtirilganligi sababli , ushbu tizimlar OLAP so'rovlarini shakllantirish uchun qulay foydalanuvchi interfeysi ( GUI - grafik foydalanuvchi interfeysi - grafik foydalanuvchi interfeysi) bilan ko'rsatilishi mumkin . Biroq, ma'lumotlar kubining ko'rinishi tahlilni faqat oldindan belgilangan o'lchamlar yordamida yaratilishi mumkin bo'lgan so'rovlar to'plami bilan cheklaydi. SQL so'rovi interfeysi nisbatan moslashuvchanroq . Bundan tashqari, OLAP tizimlari ma'lumotlarni o'rganish va hisobot berish uchun foydali bo'lsa-da, ular sizga ma'lumotlarni modellashtirishga yoki undagi naqshlarni avtomatik ravishda aniqlashga imkon bermaydi. Katta ma'lumotlarning paydo bo'lishi ma'lumotlar bazasini yaratish uchun yangi texnologiyalarni ishlab chiqishga olib keldi. Yangi avlod ma'lumotlar bazalari ko'pincha NoSQL ma'lumotlar bazalari deb ataladi . Ular odatdagi munosabatlarga qaraganda oddiyroq modelga ega. 48 JavaScript Object Notation (JSON) kabi ob'ektni ko'rsatish tilidan foydalangan holda atributlarga ega ob'ektlar sifatida ma'lumotlarni saqlash . Ma'lumotlarning ob'ekt ko'rinishidan foydalanishning afzalligi (jadvalga asoslangan relyatsion modelga nisbatan) har bir ob'ekt uchun atributlar to'plami ob'ektning o'zida joylashganligi va bu ma'lumotlarni moslashuvchan ko'rsatish imkonini beradi. Masalan, ma'lumotlar bazasidagi ob'ektlardan biri boshqa ob'ektlarga nisbatan qisqartirilgan atributlarga ega bo'lishi mumkin. Relyatsion ma'lumotlar bazasi tuzilmasida, aksincha, jadvaldagi barcha qiymatlar bir xil atributlar (ustunlar) to'plamiga ega bo'lishi kerak. Ushbu moslashuvchanlik ma'lumotlar (turi yoki xilma-xilligi tufayli) tabiiy ravishda tuzilgan atributlar to'plamiga ajralmaganda muhimdir. Biroq, taqdimotning bunday moslashuvchanligi ma'lumotlarni turli formatlarda to'plash va saqlashga imkon beradi, ammo keyinchalik tahlil qilish uchun uni tizimlashtirish kerak 71 . Shunday qilib, 1980-yillarning oxiri - 1990-yillarning boshlarida. katta ma'lumotlar to'plamlarini tahlil qilish zarurati munosabati bilan tegishli ma'lumotlar omborlari va OLAP texnologiyalarini ishlab chiqish boshlandi . Shu bilan birga, boshqa sohalarda ham tadqiqotlar olib borildi. KDD ) bilimlarni ochish masalasini ko'tardi . Aslida, bu bir xil chuqur ma'lumotlarni tahlil qilish. Bunday ma'lumotlar bazalari odatda mavzu bo'yicha muhim bilimlar bilan birga keladi, bu ma'lumotlarning ochilishini sezilarli darajada osonlashtiradi. Katta ma'lumotlar bazalariga kirish arzon emas, shuning uchun turli statistik usullardan foydalanish kerak. Ma'lumotlar bazasidagi bilimlarni kashf qilish uchun ekspert tizimlari, mashinani o'rganish, aqlli ma'lumotlar bazalari, bilimlarni o'zlashtirish va statistika 72 kabi turli sohalardagi mavjud vositalar va usullar foydali bo'lishi mumkin . Download 1.56 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling