Matematika-informatika akulteti axborot texnologiyalari kafedrasi big data va ma


Katta xajmdagi maʼlumotlarning asosiy terminlari


Download 161.55 Kb.
bet4/20
Sana17.06.2023
Hajmi161.55 Kb.
#1553428
1   2   3   4   5   6   7   8   9   ...   20
Bog'liq
Big data va MT

1.2.Katta xajmdagi maʼlumotlarning asosiy terminlari.
Nomidan ko'rinib turibdiki, "katta ma'lumotlar" atamasi shunchaki katta hajmdagi ma'lumotlarni boshqarish va tahlil qilishni anglatadi. McKinsey Instituti hisobotiga ko'ra katta ma'lumotlar: innovatsiyalar, raqobat va mahsuldorlikning navbatdagi chegarasi bo‘lib, katta ma'lumotlar atamasi ma'lumotlarni kiritish, saqlash, boshqarish va tahlil qilish uchun odatiy ma'lumotlar bazalaridan (MB) kattaroq bo'lgan ma'lumotlar to'plamini anglatadi.
Biroq, "katta ma'lumotlar" nafaqat katta hajmdagi ma'lumotlarni tahlil qilishni o'z ichiga oladi balki, tashkilotlar katta hajmdagi ma'lumotlarni yaratadilar, lekin ularning aksariyati an'anaviy tuzilgan ma'lumotlar bazasi formatiga mos kelmaydigan formatda taqdim etadilar - bu veb-jurnallar, videolar, matnli hujjatlar, mashina kodi yoki geofazoviy ma'lumotlar bo`lishi mumkin. Bularning barchasi juda ko'p turli xil ma`lumotlar bazalarilarda, ba'zan tashkilot axborot saqlash qurilmalaridan tashqarida saqlanadi. Natijada, korporatsiyalar o'zlarining katta miqdordagi ma'lumotlariga kirishlari mumkin va bu ma'lumotlar o'rtasida aloqalarni o'rnatish hamda ulardan mazmunli xulosalar chiqarish uchun zarur vositalarga ega bo'lmaydi. Bunga ma'lumotlar tez-tez yangilanib borayotganini qo'shing va axborotni tahlil qilishning an'anaviy usullarini doimiy yangilab turadigan katta hajmdagi ma'lumotlarga mos kela olmaydigan vaziyatga duch kelinadi, bu esa pirovardida katta ma'lumotlar texnologiyalaridan foydalanishga yo'l ochadi.
Ma'lumotlar massivlarini tahlil qilishning turli usullari mavjud bo'lib, ular statistika va informatikadan olingan vositalarga asoslangan bo`lishi mumkin (masalan, mashinali oqitish). Mashinali o`qitishda ro'yxat to'liq deb da'vo qilmaydi, lekin u turli sohalardagi eng mashhur yondashuvlarni aks ettiradi. Shu bilan birga, shuni tushunish kerakki, tadqiqotchilar yangi usullarni yaratish va mavjudlarini takomillashtirish ustida ishlashni davom ettirmoqdalar. Bundan tashqari, sanab o'tilgan usullarning ba'zilari faqat katta ma'lumotlar uchun qo'llanilishi shart emas va undan kichikroq massivlar uchun muvaffaqiyatli ishlatilishi mumkin (masalan, A/B testi, regressiya tahlili). Albatta, massiv qanchalik hajmi katta bo`lsa va diversifikatsiyali tahlil qilinsa, natijada shunchalik aniq va sohaga tegishli ma'lumotlarni olish mumkin bo`ladi.
Shuning uchun quyda keltirilgan katta ma'lumotlarga doir atamalarni faqat shu sohaga qo`llaniladi deb cheklash mumkin emas:

Download 161.55 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   20




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling