Modul nomi: Katta ma’lumotlar tahliliga kirish (kirish kursi) Kurs haqida


Download 1.56 Mb.
bet35/74
Sana29.01.2023
Hajmi1.56 Mb.
#1138295
1   ...   31   32   33   34   35   36   37   38   ...   74
Bog'liq
Введение в аналитику больших массивов данных (Вводный курс) (1)

O'lchovli do'konlar yulduz va qor parchalari kabi turli xil saqlash sxemalaridan foydalanadi.


Kubning bir o'lchami bitta jadvalda (jumladan, ierarxiyaning bir nechta darajalari mavjud bo'lganda) va turli darajalarga mos keladigan bir nechta tegishli jadvallarda bo'lishi mumkin.



  1. Data mart nima?

  2. Ma'lumotlarni saqlash arxitekturasi: an'anaviy va bulutli.

53


o'lchovdagi ierarxiyalar. Agar har bir o'lchov bitta jadvalda bo'lsa, bu ma'lumotlar ombori sxemasi yulduzcha sxema deb ataladi . Bunday sxemaning namunasi rasmda ko'rsatilgan. o'n bir.


Guruch. 11. Yulduzli zanjirga misol 81



  • Yulduz sxemasining markazi ma'lumotlar (fakt jadvali) va o'lchamlari uning nurlarini tashkil qiladi. Faktlar jadvali hisobot uchun ishlatiladigan jamlangan ma'lumotlarni o'z ichiga oladi va o'lchovlar jadvali saqlangan ma'lumotlarni tavsiflaydi.



Yulduzli sxemaning juda oddiy tuzilishi murakkab so'rovlarni yozishni sezilarli darajada osonlashtiradi.
Agar kamida bitta o'lchov bir nechta tegishli jadvallarda mavjud bo'lsa, bunday ma'lumotlar ombori sxemasi qor parchasi sxemasi deb ataladi . Odatda o'zgartirish ierarxiyasining yuqori darajalariga mos keladigan bunday sxemadagi o'lchamlarning qo'shimcha jadvallari


81 Ma'lumotlarni saqlash [Elektron resurs]. URL: https://portal.tpu.ru/


SHARED/p/PAN/Wrk/Tab9/Lk.doc (19.06.2020 dan foydalanilgan).

54


renium va ierarxiyaning quyi darajasiga mos keladigan asosiy o'lchovlar jadvalida birdan ko'pga bog'liq bo'lganlar, ba'zan konsol jadvallari deb ataladi (o'zgaruvchan jadval) . Qor parchalari sxemasiga misol rasmda ko'rsatilgan. 12.


Guruch. 12. Qor parchalari sxemasiga misol 82


Sxema faktlar jadvalini bir qator denormalizatsiyalangan o'lchov jadvallariga ajratadi. Denormalizatsiya qilingan dizaynlar kamroq murakkab, chunki ma'lumotlar guruhlangan. Haqiqat jadvali har bir o'lchov jadvaliga biriktirish uchun faqat bitta havoladan foydalanadi.


Qor parchasi sxemasi normallashtirilgan ma'lumotlardan foydalanishi bilan farq qiladi. Normalizatsiya ma'lumotlarning barcha bog'liqliklari aniqlanishi va har bir jadvalda minimal ortiqcha bo'lishi uchun ma'lumotlarni samarali tashkil etish demakdir. Shunday qilib, o'lchov jadvallari alohida o'lchov jadvallariga tarmoqlanadi.



  1. Ma'lumotlar omborlari.

55


Ushbu sxema diskda kamroq joy ishlatadi va ma'lumotlar yaxlitligini yaxshiroq saqlaydi. Uning asosiy kamchiligi ma'lumotlarga kirish uchun zarur bo'lgan so'rovlarning murakkabligidir: har bir so'rov mos keladigan ma'lumotlarni olish uchun bir nechta jadval birikmalaridan o'tishi kerak 83 .


Hatto ierarxik o'lchamlar mavjud bo'lganda ham, ma'lumotlar omborini so'rash tezligini oshirish uchun ko'pincha yulduz sxemasiga ustunlik beriladi.


Biroq, barcha ma'lumotlar omborlari ushbu ikkita sxema bo'yicha ishlab chiqilmagan. Shunday qilib, ko'pincha "sana" tipidagi ma'lumotlarni o'z ichiga olgan o'lchov uchun kalit maydoni va mos keladigan o'lchovlar jadvali o'rniga, faktlar jadvalining o'zi "sana" tipidagi kalit maydonini o'z ichiga olishi mumkin. Bunday holda, mos keladigan o'lchamlar jadvali oddiygina mavjud emas.


O'lchovli do'konlarning asosiy afzalligi - ishlab chiquvchilar va foydalanuvchilar uchun ularning soddaligi va ravshanligi. Bundan tashqari, ma'lumotlarni yanada samarali saqlash va rasmiylashtirilgan o'lchovlar, ayniqsa, murakkab tahlillar uchun ma'lumotlarga kirishni osonlashtiradi va tezroq qiladi. Asosiy kamchilik - ma'lumotlarni tayyorlash va yuklash, shuningdek, ma'lumotlar o'lchamlarini boshqarish va o'zgartirish uchun yanada murakkab protseduralar.


ma'lumotlarni yuklashning turli usullarida farqlanadi . Ajratish:


1   ...   31   32   33   34   35   36   37   38   ...   74




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling