Big data tahlili
Download 1.27 Mb.
|
A.X.Ruzmetov Qollanma
- Bu sahifa navigatsiya:
- Hadoop
Nazorat savollari:
MapReduce-ning paydo bo‘lishi haqida ma’lumot bering? map funksiyasi haqida tushuncha bering? map va reduce qanday qo‘llaniladi? MapReduce xatti-harakatlarining asosiy printsiplari qaysilar? MapReduce vazifalari haqida ma’lumot bering? MapReduce optimallash usullari toifaga bo‘linadi? MapReduce fayl tizimidanimalarga e’tibor qaratish kerak? MapReduce dasturini ustunligi nimada? 9-BOBHADOOPUshbu bobda Hadoop va u nima uchun muhim Hadoop taqsimlangan fayl tizimi Hadoop ni MapReduce-ga yozish Hadoopni ishga tushirish Katta ma’lumot manbalarini boshqarish kerak bo‘lganda, an’anaviy yondashuvlar ishlamaydi. Katta ma’lumotlarning hajmi, tezligi va xilma-xilligi aksariyat texnologiyalarni tiz cho‘ktiradi, shuning uchun ushbu yangi vazifani bajarish uchun yangi texnologiyalar yaratilishi kerak edi. MapReduce - bu yangi texnologiyalardan biri, ammo bu shunchaki algoritm, barcha ma’lumotlarni mantiqiy qabul qilish retsepti. MapReduce-dan maksimal darajada foydalanish uchun nafaqat algoritm kerak. Katta ma’lumotlar muammolarini hal qilish uchun mo‘ljallangan mahsulotlar va texnologiyalar to‘plami kerak. HadoopYahoo! kabi qidiruv tizimining innovatorlari va Google o‘z tizimlari to‘playotgan katta hajmdagi ma’lumotlarni tushunishning yo‘lini topishi kerak edi. Ushbu kompaniyalar qanday ma’lumotlarni to‘playotganlarini va o‘z biznes modellarini qo‘llab-quvvatlash uchun ushbu ma’lumotlardan qanday qilib pul ishlashlari mumkinligini tushunishlari kerak edi. Bu kompaniyalar uchun katta hajmdagi ma’lumotlarni osongina boshqarish uchun eng amaliy usul - Hadoop ishlab chiqilgan. Hadoop katta muammolarni kichik qismlarga ajratishga imkon beradi, shunda tahlil tez va iqtisodiy jihatdan amalga oshiriladi. Katta ma’lumotlar muammosini parallel ravishda qayta ishlanishi mumkin bo‘lgan kichik qismlarga ajratish orqali ma’lumotni qayta ishlashingiz va natijalarni taqdim etish uchun kichik qismlarni qayta o‘rnatishingiz mumkin. Hadoop (http://hadoop.apache.org) dastlab Yahoo! Ning Doug Cutting ismli muhandis tomonidan yaratilgan va xozirda Apache Software Foundation tomonidan boshqariladigan ochiq kodli loyihadir. U Apache License v2.0 ostida mavjud. 10-bobda ko‘rib chiqilgan boshqa loyihalar bilan bir qatorda Hadoop katta ma’lumotlarni yig‘ish va qayta ishlashga qaratilgan asosiy qurilish blokidir. Hadoop hisoblash tezligini oshirish va kechikishni yashirish uchun hisoblash tugunlari o‘rtasida ma’lumotlarni qayta ishlashni parallellashtirishga mo‘ljallangan. Hadoop asosan ikkita asosiy tarkibiy qismga ega: Download 1.27 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling