Modul nomi: Katta ma’lumotlar tahliliga kirish (kirish kursi) Kurs haqida
Download 1.56 Mb.
|
Введение в аналитику больших массивов данных (Вводный курс) (1)
moslashuvchanlik va ma'lumotlar mavjudligi bilan tavsiflanadi :
foydalanuvchilarga va keyingi ilovalarga sxemasiz, ya'ni kelib chiqishidan qat'i nazar, "tabiiy" formatdagi ma'lumotlarni taqdim etishi mumkin. Bu erda biror narsani oldindan belgilashning hojati yo'q. korporativ omborlardan foydalanganda, hatto boshida ham unga tegishli bo'lgan ma'lumotlar turlari va tuzilmalarini aniqlash zarur bo'lganda va yangi ma'lumotlar formatlari paydo bo'lgan taqdirda, ma'lumotlar bazasini qayta qurish kerak bo'ladi 104 ; ma'lumotlar bazasida barcha ma'lumotlar hozirda kompaniya uchun foydali va dolzarbdir. Hozircha foydasiz bo'lib ko'ringan ma'lumotlar elakdan o'tkaziladi va abadiy yo'qoladi. Ma'lumotlar bazalari har doim qo'lda bo'lishi kerak bo'lgan muhim ma'lumotlarni saqlash yoki asosiy tahlillar uchun idealdir. Ma'lumotlar ko'llari, boshqa narsalar qatori, kelajakda foydali bo'lishi mumkin bo'lgan yoki hech qachon kerak bo'lmaydigan ma'lumotlarni saqlaydi. Ularda xom ashyo arxivlarini saqlash, keng ko'lamli tahliliy 105 uchun katta baza yaratish qulay ; ko'pgina ma'lumotlar ko'li ilovalari qisman qo'llab-quvvatlamaydi yopishqoq yoki bosqichma - bosqich yuklash . Tashkilot yuklay olmaydi Ma'lumotlaringizning qismlarini ma'lumotlar ko'liga siqish yoki qayta yuklash (ya'ni, hammasi yoki hech narsa); Springer E. Ma'lumotlar ko'llari nima va ularda saqlash nima uchun arzonroq katta ma'lumotlar. Mana. Mana. 70 ma'lumotlar ko'li odatda byudjet serverlari asosida quriladi Apache Hadoop , qimmatbaho litsenziyalar va kuchli apparatlarsiz, SAP kabi ixtisoslashtirilgan Data Warehouse sinf platformalarini loyihalash va sotib olishning yuqori xarajatlaridan farqli o'laroq , Oracle , Teradata va boshqalar. 106 ; ma'lumotlar ko'llariga kirishda foydalanuvchilar o'zlariga kerakli ma'lumotlar va manbalarning aniq turlarini bilishlari kerak; ularga qancha ma'lumot kerak; ularga kerak bo'lganda; ushbu ma'lumotlarga qo'llaniladigan analitik usullar. Ma'lumotlar omborida bu mumkin emas. nyh. Shuning uchun, ma'lumotlar ko'lining sxemasi "yozish bilan" emas, balki "o'qish orqali" aniqlanadi . Ma'lumotlar ko'li hali ham sxemani talab qiladi, lekin u oldindan belgilanmagan. Bu ad hoc 107 . Ma'lumotlar foydalanuvchilar uni yuklab olganlarida emas, balki uni olganlarida reja yoki naqshga muvofiq foydalaniladi. Ma'lumotlar ko'llari ma'lumotlarni o'zgartirilmagan (tabiiy) holatda saqlaydi; foydalanuvchilar ma'lumotlarni so'ramaguncha talablar aniqlanmaydi. Shunday qilib, ma'lumotlar ko'li bo'lsa, ma'lumotlar ma'lumotlarni ajratib olish yoki ularni tahlil qilish zarur bo'lganda chiqishda tuziladi. Shu bilan birga, tahlil jarayoni ko'ldagi ma'lumotlarning o'ziga ta'sir qilmaydi: ular tuzilmagan bo'lib qoladi, shuning uchun ular ham qulay tarzda saqlanishi va boshqa maqsadlarda ishlatilishi mumkin 108 ; To'g'ri foydalanilganda, ma'lumotlar ko'li biznes va texnik foydalanuvchilarga imkon beradi Download 1.56 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling