Spark ko'p qirrali bo'lsa ham, bu Sparkning xotiradagi imkoniyatlari barcha foydalanish holatlari uchun eng mos ekanligini anglatmaydi:
Ko'p oddiy foydalanish holatlari uchun Apache MapReduce va Hive mosroq tanlov bo'lishi mumkin
Spark ko'p foydalanuvchi muhiti sifatida ishlab chiqilmagan
Spark foydalanuvchilari ularda mavjud bo'lgan xotira ma'lumotlar to'plami uchun etarli ekanligini bilishlari kerak
Ko'proq foydalanuvchilarni qo'shish qiyinchiliklarni keltirib chiqaradi, chunki foydalanuvchilar kodni ishlatish uchun xotiradan foydalanishni muvofiqlashtirishlari kerak
Bulutlar va superkompyuterlar ma'lumotlar markazida birgalikda tarmoqqa ulangan kompyuterlar to'plamidir
Bulutlar superkompyuterlarga qaraganda turli tarmoqlar, kiritish-chiqarish, protsessor va xarajat almashinuviga ega
Bulutli ish yuklari maʼlumotlarga yoʻnaltirilgan. hisoblashga yo'naltirilgan va superkompyuterlarga qaraganda kamroq bog'langan
tamoyillari ikkalasida ham bir xil
Apache Hadoop va Spark va boshqalar. MPI- ni oching
MPI, albatta , Hadoop- dan o'zib ketadi , lekin HPC va katta ma'lumotlarni, jumladan Spark va HARPni birlashtirgan boshqa texnologiyalarning gibrid yondashuvi yordamida kuchaytirilishi mumkin. Dr. Jefri Foks, Indiana universiteti. ( http://arxiv.org/pdf/1403.1528.pdf )
Xulosa
Hadoop (HDFS, MapReduce )
Katta ma'lumotlarni qayta ishlash uchun oson echimni taqdim etadi
Tarqalgan tizimni dasturlashda paradigma o'zgarishini keltirib chiqaradi
Uchqun
Xotirada hisoblash uchun MapReduce kengaytirilgan
oqimli, interaktiv, iterativ va mashinani o'rganish vazifalari uchun
Dunyoni o'zgartirish
Ma'lumotlarni qayta ishlashni arzonroq va samaraliroq va kengaytiriladigan qildi
Boshqa ko'plab vositalar va dasturlarning asosidir
Do'stlaringiz bilan baham: |