Ushbu misolda tuzilgan katta ma'lumotlar so'rovlari uchun SQL-on- Hadoop sinfidagi mashhur vosita Apache Hive ishlatiladi . Fayllarni saqlashning o'zi Hadoop klasterida Cloudera (CDH) kompaniyasining tijorat tarqatish asosida tashkil etilgan . An'anaviy bank DWH xissa parallel DBMS ustida amalga oshirilmoqda Greenplum [6] . O'z ustida, biz bu qo'shishingiz Cloudera Impala harakat mumkin Apache muqobil sifatida Xiva kabi, Greenplum , Arenadata JB va Teradata, bir xissa parallel me'morchiligi asoslangan. Biroq, uyani tanlash yuqori nosozliklarga bardoshlik va yuqori ish unumdorligi zarur bo'lsa, oqlanadi. Biz bu erda Apache Hive va Cloudera Impala o'rtasidagi o'xshashlik va farqlar haqida ko'proq gaplashdik . Tinkoff Bank ishiga qaytsak, BI vositalari ko'l va klassik DWH ma'lumotlarini o'qiydi, odatda OLAP hisobotlarini Big Data omboridagi ma'lumotlar bilan boyitadi . Bu qiziqishlarni tahlil qilish, xatti-harakatlarni bashorat qilish va bank veb-saytiga tashrif buyuruvchilar orasida paydo bo'ladigan hozirgi va kelajakdagi ehtiyojlarni aniqlash uchun ishlatiladi.
Ko'pchiligingiz bilasizki, inventarizatsiya tizimi uchun 3NF tomonidan yaratilgan ma'lumotlar bazasida ko'pchilik bir-biriga bog'liq jadvallar mavjud. Masalan, joriy inventarizatsiya ma'lumotlari to'g'risidagi hisobot 12 dan ortiq qo'shilgan shartlarni o'z ichiga olishi mumkin. Bu so'rov va hisobotning javob vaqtini tezda sekinlashtirishi mumkin. Ma'lumotlar ombori javob berish vaqtini qisqartirishga yordam beradigan va hisobotlar va tahlillar uchun so'rovlarning ishlashini yaxshilashga yordam beradigan yangi dizaynni taqdim etadi.
Do'stlaringiz bilan baham: |