Reja: Manba Wikibon Mapreduce Hadoop sap xana
Download 21.67 Kb.
|
katta ma\'lumotlarni va data science
Mapreduce - hisob-kitoblarni taqsimlash modeli. U juda katta ma'lumot to'plamlari (petabaytlar) bo'yicha parallel hisoblashlarda qo'llaniladi. Dastur interfeysida ma'lumotlar qayta ishlash uchun dasturga emas, balki dastur ma'lumotlarga uzatiladi. Shunday qilib, so'rov alohida dastur bo’lib, jarayon printsipi – ikki usulida ma'lumotlarni ketma-ket qayta ishlaydi, Map (Xarita) dastlabki ma'lumotlarni tanlaydi va Reduce ularni agregatlarini qisqartiradi
Hadoop - Facebook, eBay, Amazon va boshqalarga yuklangan saytlarni qidirish va kontekstual mexanizmlarini amalga oshirishda foydalaniladi. O’ziga xos xususiyati shundaki, tizim biron bir klaster tugunlarining ishdan chiqmasidan himoyalangan, chunki har bir blok tugunda boshqa ma'lumotlarning kamida bitta nusxasi bor. SAP XANA - ma'lumotlarni saqlash va qayta ishlash uchun yuqori samarali NewSQL platformasi. Yuqori tezlikda so'rovlarni qayta ishlashni ta'minlaydi. Yana bir o'ziga xos jihat shundaki, SAPXANA analitik tizimlarni qo'llab-quvvatlash xarajatlarini kamaytirgan holda, tizim landshaftini soddalashtiradi. Shunindek, Big Data tegishli vositalar Hive, HBase, MapReduce, Spark RDD, Spark Streaming, SparkSQL, SparkR, MLlib, Flume, Sqoop, Oozie, Kafka, Data freymlari va GraphX vositalari bilan ishlaydi. Texnologik uskunalar quyidagilarni o'z ichiga oladi: serverlar infratuzilma uskunalari. Serverlar ma'lumotlar omborini o'z ichiga oladi. Infratuzilma uskunalari platformani tezlashtirish vositalari, uzluksiz quvvat manbalari, server konsollari to'plamlari va boshqalarni o'z ichiga oladi. Xizmatlar Xizmatlar ma'lumotlar bazasi arxitekturasini yaratish, infratuzilmani tashkil qilish va optimallashtirish, ma'lumotlarni saqlashni ta'minlashni o'z ichiga oladi. Dasturiy ta'minot, uskunalar, shuningdek xizmatlar birgalikda ma'lumotlarni saqlash va tahlil qilish uchun keng qamrovli platformani tashkil etadi. Microsoft, HP, EMC kabi kompaniyalar Big Data yechimlarini ishlab chiqish, tarqatish va ularni boshqarish bo'yicha xizmatlarni taklif qilishadi. Dunyoda raqamlangan ma'lumotlar hajmi #ekponent bo'yicha o'sib bormoqda. IBS kompaniyasining ma'lumotlariga qaraganda, 2003-yilda 5 eksabayt(1 eksabayt - 1 milliard gigabayt) ma'lumot yig'ilgan ekan. 2008-yilda u 0.18 zettabayt(1 zettabayt = 1024 eksabayt) gacha, 2011-yilga kelib 1.76 zettabayt, 2013-yilda 4.4 zettabaytgacha yetibdi. 2015-yilning mayida dunyoda yig'ilgan raqamlanga ma'lumotlar hajmi 6.5 zettabaytdan oshib ketibdi. 2020-yilga kelib insoniyat 40-44 zettabayt raqamli ma'lumot hosil qilar ekan. IBS mutaxassislarining fikriga ko'ra, 2013-yilda yig'ilgan ma'lumotlar massivining atiga 1.5%i qandaydiy axborot qiymatiga ega bo'lgan ekan. Baxtga qarshi, hozir dunyoda katta ma'lumotlarni qayta ishlash texnologiyalari bo'lib, ular yordamida juda katta ma'lumotlar massividan insonlarga kerak, qiziq bo'lgan, foydali ma'lumotlarni ajratib olish mumkin bo'ladi. Ushbu maqolada Big Data(katta ma'lumotlar)ning 8 eng asosiy atamalari va ular haqida qisqacha tushunchalar beriladi. Download 21.67 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling