Axborot texnologiyalari va kommunikatsiyalarni


Strukturaviy bo'lmagan ma'lumotlarga ega


Download 329 Kb.
bet11/17
Sana01.03.2023
Hajmi329 Kb.
#1241527
1   ...   7   8   9   10   11   12   13   14   ...   17
Bog'liq
kZzCm68V0YejIlSdyk8amQg1r2LKAcJV

Strukturaviy bo'lmagan ma'lumotlarga ega
Muayyan ichki tuzilma: bu oddiy matn, grafik ma'lumotlar va boshqalar bo'lishi mumkin. MapReduce tizimlashtirilmagan yoki yarim tuzilgan ma'lumotlar bilan yaxshi ishlaydi, chunki texnologiya qayta ishlash jarayonida ma'lumotlarni sharhlash uchun mo'ljallangan. Boshqacha qilib aytganda, MapReduce kiritish kalitlari va qiymatlari ma'lumotlarning ichki xususiyatlari emas, balki ¬ma'lumotlarni tahlil qiluvchi shaxs tomonidan tanlanadi.
Aloqaviy ma'lumotlar ko'pincha yaxlitlikni saqlash va ¬ortiqchalikni yo'q qilish uchun normallashtiriladi . Normalizatsiya MapReduce uchun muammolarni keltirib chiqaradi, chunki u yozuvni o'qishni mahalliy bo'lmagan operatsiyaga aylantiradi, lekin MapReduce ishlashi uchun eng muhim -shartlardan biridir. (yuqori tezlikda ) oqimli o'qish va yozishni amalga oshirish qobiliyatidir .¬
Oddiylashtirilmagan yozuvlar to'plamining ¬yaxshi namunasi veb-server jurnalidir ( masalan, har bir mijoz jurnalda bir necha marta paydo bo'lishi mumkin bo'lsa ham, har bir yozuv mijozning xost nomlarini to'liq ro'yxatini beradi). Shu sababli, barcha turdagi redo log fayllari MapReduce vositalari tomonidan tahlil qilish uchun juda mos keladi .
MapReduce dasturlash modeli chiziqli masshtabli. Dastur ¬ikkita funktsiyani (xaritalash funktsiyasi va konvolyutsiya funktsiyasi) yozadi, ularning har biri kalit/qiymat juftlarining bir to'plamidan boshqa to'plamga xaritalashni belgilaydi. Bu funksiyalar maʼlumotlarning oʻlchamiga yoki ular ishlayotgan klasterga bogʻliq emas, shuning uchun ular kichik va yirik maʼlumotlar toʻplamlari uchun oʻzgarmagan holda ishlatilishi mumkin. Eng muhimi, kirish hajmini ikki baravar oshirish ishning ikki barobar sekin ishlashiga olib keladi, lekin klaster hajmini ikki barobarga oshirish ishni asl ish kabi tez bajaradi. SQL so'rovlari uchun umumiy holatda, bu tasdiq o'rinli emas.
MapReduce tizimlari o'rtasidagi farqlar¬ o'chiriladi - relyatsion ma'lumotlar bazalari MapReduce ning ba'zi tushunchalarini amalga oshirishni boshlaganda (masalan, Aster ma'lumotlar bazalarida Aster Data va Greenplum ) va boshqa tomondan, MapReduce -ga asoslangan yuqori darajadagi so'rovlar tillari (masalan, Pig va Hive ) MapReduce tizimlarini yaratadi an'anaviy ma'lumotlar bazasi dasturchilari uchun qulayroq .

Download 329 Kb.

Do'stlaringiz bilan baham:
1   ...   7   8   9   10   11   12   13   14   ...   17




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling