Bitta diskdan barcha ma'lumotlarni o'qish juda sekin, yozish esa undan ham sekinroq. O'qish vaqtini qisqartirishning aniq yo'li bir vaqtning o'zida bir nechta disklardan ma'lumotlarni o'qishdir. Tasavvur qiling-a, sizda 100 ta disk bor, ularning har biri ma'lumotlarning 1/100 qismini o'z ichiga oladi. Ushbu disklar parallel ravishda ishlayotgan bo'lsa, ma'lumotlar ikki daqiqada o'qiladi. - Bitta diskdan barcha ma'lumotlarni o'qish juda sekin, yozish esa undan ham sekinroq. O'qish vaqtini qisqartirishning aniq yo'li bir vaqtning o'zida bir nechta disklardan ma'lumotlarni o'qishdir. Tasavvur qiling-a, sizda 100 ta disk bor, ularning har biri ma'lumotlarning 1/100 qismini o'z ichiga oladi. Ushbu disklar parallel ravishda ishlayotgan bo'lsa, ma'lumotlar ikki daqiqada o'qiladi.
Bir qarashda, diskning yuzdan bir qismini ishlatish g'oyasi behuda ko'rinadi . Lekin biz har biri bir terabayt bo'lgan yuzta ma'lumotlar to'plamini saqlashimiz va ularni baham ko'rishimiz mumkin. Ehtimol, bunday tizim foydalanuvchilari tezroq ma'lumotlarni tahlil qilish evaziga umumiy foydalanishni qabul qilishga tayyor bo'ladi; bundan tashqari, statistik ma'lumotlarga ko'ra, ularning ma'lumotlarni tahlil qilish vazifalari vaqt o'tishi bilan tarqalish ehtimoli ko'proq va bir-biriga aralashish ehtimoli kamroq. Biroq, bir nechta disklarda parallel ravishda ma'lumotlarni o'qish va yozish tushunchasi juda oddiy emas. - Bir qarashda, diskning yuzdan bir qismini ishlatish g'oyasi behuda ko'rinadi . Lekin biz har biri bir terabayt bo'lgan yuzta ma'lumotlar to'plamini saqlashimiz va ularni baham ko'rishimiz mumkin. Ehtimol, bunday tizim foydalanuvchilari tezroq ma'lumotlarni tahlil qilish evaziga umumiy foydalanishni qabul qilishga tayyor bo'ladi; bundan tashqari, statistik ma'lumotlarga ko'ra, ularning ma'lumotlarni tahlil qilish vazifalari vaqt o'tishi bilan tarqalish ehtimoli ko'proq va bir-biriga aralashish ehtimoli kamroq. Biroq, bir nechta disklarda parallel ravishda ma'lumotlarni o'qish va yozish tushunchasi juda oddiy emas.
- Birinchidan, uskunaning ishdan chiqishi ehtimolini hisobga olish kerak; bitta o'rniga ko'plab qurilmalardan foydalanishni boshlashingiz bilan ulardan birida ishlamay qolish ehtimoli sezilarli darajada oshadi. Ma'lumotlar yo'qolishining oldini olishning standart usuli - bu replikatsiya: tizim ma'lumotlarning ortiqcha nusxalarini saqlaydi, shunda xatolik yuz berganda boshqa nusxasi mavjud bo'ladi. Masalan, RAID massivlari shunday ishlaydi , garchi siz yaqinda bilib olganingizdek, Hadoop fayl tizimi HDFS ( Hadoop _ tarqatilgan Fayl tizimi ) - biroz boshqacha yondashuvni qo'llaydi.
Do'stlaringiz bilan baham: |