Ona davlat universiteti matematika informatika fakulteti


Katta xajmdagi maʼlumotlarning asosiy terminlari


Download 22.17 Kb.
bet2/5
Sana27.01.2023
Hajmi22.17 Kb.
#1130900
1   2   3   4   5
Bog'liq
SHAMSHER BIG DATA

Katta xajmdagi maʼlumotlarning asosiy terminlari


Katta hajmli maʼlumot (inglizcha: Big data) — katta hajmdagi ma´lumotlarga nisbatan qo´llanadigan termin hisoblanadi(odatda terabayt, ekzabayt va petabaytlar darajasida). Ushbu ma´lumotlarni amaldagi va yangi yaratilayotgan texnologiyalar yordamida to´plash, taqsimlash, o´zgartirishlar kiritish, tahlil qilish, saqlash va vizual shaklda tasvirlash imkoni bo´lishi kerak. Ma´lumotlar miqdorining tez o´sishiga so´nggi yillarda kuzatilayotgan texnologik taraqqiyot va buning natijasi hisoblanmish mashina tomonidan yaratilayotgan ma´lumotlarning ko´payib borishi sababchidir. RFID-texnologiyasining keng tarqalishi, elektron transaksiyalarning moliya sohasida keng qo´llanilishi, ilmiy-tadqiqot muassasalarining to´plagan natijalari, web-texnologiyalarining keng tarqalishi, telekommunikasion tizimlardagi protokollar shular jumlasidandir. Big Data aslida ilmiy-tadqiqotga aloqador sohalarda avvaldan ham mavjud bo´lgan bo´lsa-da, lekin so´nggi yillardagina ushbu fenomen ko´proq tilga olinadigan bo´ldi. Buning sababi shundaki, katta miqdordagi ma´lumotlarni tahlil qilish endi iqtisodiy tashkilotlar tomonidan ham keng qo´llanila boshlanishi va buning oqibatida ma´lumotlar tahlilining raqobatbardoshlikni oshirish va samaradorlikni kuchaytirish kabi muhim masalasarda asosiy o´rinni egallaganidir. Big Data odatiy Bosh Informasion Mutaxassis (Chief Information Officer - CIO) uchun qo´shimcha vazifalar va talablar yaratishdan tashqari, yangi Ma´lumot Boshqaruvchisi (Data Steward) va Ma´lumot bo´yicha mutaxassis (Data Scientist) kabi kasblarning paydo bo´lishiga olib keldi.


Ingliz tilidan tarjima qilingan-Analitika - bu ma'lumotlar yoki statistik ma'lumotlarni tizimli hisoblash tahlili. U ma'lumotlardagi mazmunli naqshlarni topish, talqin qilish va muloqot qilish uchun ishlatiladi. Bu, shuningdek, samarali qarorlar qabul qilish uchun ma'lumotlar namunalarini qo'llashni o'z ichiga oladi.
Yozilgan ma'lumotlarga boy hududlarda qimmatli bo'lishi mumkin; Analitika samaradorlikni aniqlash uchun statistik ma'lumotlar, kompyuter dasturlash va operatsion tadqiqotlarni bir vaqtda qo'llashga tayanadi.
Tashkilotlar biznes samaradorligini tavsiflash, bashorat qilish va yaxshilash uchun biznes ma'lumotlariga tahlilni qo'llashlari mumkin. Xususan, tahliliy sohalarga tavsifiy tahlil, diagnostik tahlil, bashoratli tahlil, retseptiv tahlil va kognitiv tahlil kiradi. Analitika marketing, menejment, moliya, onlayn tizimlar, axborot xavfsizligi va dasturiy ta'minot xizmatlari kabi turli sohalarda qo'llanilishi mumkin. Analitika keng qamrovli hisoblashni talab qilishi mumkinligi sababli (katta maʼlumotlarga qarang), tahlil uchun ishlatiladigan algoritmlar va dasturiy taʼminot kompyuter fanlari, statistika va matematikadagi eng zamonaviy usullardan foydalanadi.[
Maʼlumotlar bazasi — markazlashtirilgan maʼlumotlar ombori. Maʼlumotlarni oʻqish, saqlash, qayta ishlash va qidirish uchun moʻljallangan. O´zining tezligi bilan ajralib turadi. Eng mashhur maʼlumotlar bazasiga Oracle, MsSQl, MySQL va boshqalar kiradi.
Keng ma’noda ma’lumotlar bazasi - bu qandaydir bir predmet sohasidagi real muhitning aniq ob’ektlari haqidagi ma’lumotlar to‘plamidir. Predmet sohasi deganda avtomatlashtirilgan boshqarishni tashkil qilish uchun o‘rganilayotgan real muhitning ma’lum bir qismi tushiniladi. Masalan, korxona, zavod, ilmiy tekshirish instituti, oliy o‘quv yurti va boshqalar.
Shuni qayd qilish lozimki, MBni yaratishda ikkita muhim shartni hisobga olmoq zarur:
Birinchidan, ma’lumotlar turi, ko‘rinishi, ularni qo‘llaydigan programmalarga bog‘liq bo‘lmasligi lozim, ya’ni MBga yangi ma’lumotlarni kiritganda yoki ma’lumotlar turini o‘zgartirganda, programmalarni o‘zgartirish talab etilmasligi lozim.
Ikkinchidan, MBdagi kerakli ma’lumotni bilish yoki izlash uchun biror programma tuzishga hojat qolmasin.
Shuning uchun ham MBni tashkil etishda ma’lum qonun va qoidalarga amal qilish lozim. Bundan buyon axborot so‘zini ma’lumot so‘zidan farqlaymiz, ya’ni axborot so‘zini umumiy tushuncha sifatida qabul qilib, ma’lumot deganda aniq bir belgilangan narsa yoki hodisa sifatlarini nazarda tutamiz.
Ma’lumotlar bazasini yaratishda, foydalanuvchi axborotlarni turli belgilar bo‘yicha tartiblashga va ixtiyoriy belgilar birikmasi bilan tanlanmani tez olishga intiladi. Buni faqat ma’lumotlar tizilmalashtirilgan holda bajarish mumkin.
Tizilmalashtirish – bu ma’lumotlarni tasvirlash usullari haqidagi kelishuvni kiritishdir. Agar ma’lumotlarni tasvirlash usuli haqida kelishuv bo‘lmasa, u holda ular tizilmalashtirilmagan deyiladi. Tizilmalashtirilmagan ma’lumotlarga misol sifatida matn fayliga yozilgan ma’lumotlarni ko‘rsatish mumkin.
Ma’lumotlar bazasidan foydalanuvchilar turli amaliy dasturlar, dasturiy vositalari, predmet sohasidagi mutaxassislar bo‘lishi mumkin.
Ma’lumotlar bazasining zamonaviy texnologiyasida ma’lumotlar bazasini yaratish, uni dolzarb holatda yuritishni va foydalanuvchilarga undan axborot olishini ta’minlovchi maxsus dasturiy vosita, ya’ni ma’lumotlar bazasini boshqarish tizimi yordami bilan markazlashtirilgan holda amalga oshirishni nazarda tutadi.
Har bir MB jadvali o‘zining birlamchi kalitiga ega bo‘lishi mumkin. Birlamchi kalit deganda ezuvlar kaytarilmasligini ta’minlovchi maydon (polya) yoki maydonlar guruxi tushiniladi. Birlamchi kalit sifatida ishlatiladigan maydon eki maydonlar guruxi, bir xil yozuvga ega bo‘lmaslik shartini bajarishi kerak. Boshqa maydonlarida bir xil yozuvlar takrorlanishi mumkin. Shu sabab ular birlamchi kalit bo‘laolmaydi. Birlamchi kalit qisqa va sonli maydonlardan tashkil topishi maqsadga muvofiqdir. MB jadvaliga birlamchi kalitni kiritishdan maqsad, jadvaldagi ma’lumotlarni izlash, tartiblashtirish va tanlab olishda qulaylikni beradi. Birlamchi kalit kiritish yoki kiritmaslik foydalanuvchi tamonidan MB jadvali strukturasini tashkil qilishda aniqlanadi.
Bosh jadval yordamida qaram jadvaldagi mos ma’lumotlarni chaqirishni ta’minlash uchun qaram jadvalda tashqi kalit tashkil qilinadi. “Bitta-ko‘pga” bog‘lanish holatida tashqi kalit bosh jadvalda tashkil qilinadi. Birinchi va ikkinchi kalitlarni aniqlashda MBBT avtomatik ravishda jadvalda indekslarni quradi.

  1. Katta hajmdagi maʼlumotlarga qoʼyiladigan talablar.


Dunyoda raqamlangan ma'lumotlar hajmi #ekponent bo'yicha o'sib bormoqda. IBS kompaniyasining ma'lumotlariga qaraganda, 2003-yilda 5 eksabayt(1 eksabayt - 1 milliard gigabayt) ma'lumot yig'ilgan ekan. 2008-yilda u 0.18 zettabayt (1 zettabayt = 1024 eksabayt) gacha, 2011-yilga kelib 1.76 zettabayt, 2013-yilda 4.4 zettabaytgacha yetibdi. 2015-yilning mayida dunyoda yig'ilgan raqamlanga ma'lumotlar hajmi 6.5 zettabaytdan oshib ketibdi. 2020-yilga kelib insoniyat 40-44 zettabayt raqamli ma'lumot hosil qilar ekan.


IBS mutaxassislarining fikriga ko'ra, 2013-yilda yig'ilgan ma'lumotlar massivining atiga 1.5%i qandaydiy axborot qiymatiga ega bo'lgan ekan. Baxtga qarshi, hozir dunyoda katta ma'lumotlarni qayta ishlash texnologiyalari bo'lib, ular yordamida juda katta ma'lumotlar massividan insonlarga kerak, qiziq bo'lgan, foydali ma'lumotlarni ajratib olish mumkin bo'ladi.
Ushbu mustaqil ishimda Big Data(katta ma'lumotlar)ning 8 eng asosiy atamalari va ular haqida qisqacha tushunchalar beriladi.

Download 22.17 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling