Ma'ruza Kirish. Axborotlarni izlash va ajratib olish tushunchalari. Axborotlarni izlash va ajratish xaqida asosiy tushunchalar. Axborotlarni ajratish va izlashning nazariy mezonlari. Axborot izlash strategiyasini loyihalash bosqichlari


Ma'ruza 13. Elektron resurslarni sinflash modeli, usul va algoritmlari


Download 225.96 Kb.
bet8/9
Sana25.04.2023
Hajmi225.96 Kb.
#1398325
1   2   3   4   5   6   7   8   9
Bog'liq
Ma\'ruza Kirish. Axborotlarni izlash va ajratib olish tushunchala

Ma'ruza 13. Elektron resurslarni sinflash modeli, usul va algoritmlari.
Sinflashtirish tushunchasi. So‘rovlar bo‘yicha elektron resurslarni sinflash. Matnlarni sinflash modeli. Elektron resurslarni ajratib olish so‘rovlari.

Reja : 1. Elektron resurslarni sinflash modeli, usul va algoritmlari.


2. Matnlarni sinflash modeli.
Elektron resurslarni sinflash modeli, usul va algoritmlari.
Axborotni to'plash va ro'yxatdan o'tkazish Axborotni to'plash va ro'yxatdan o'tkazish turli saytlarda turli yo'llar bilan amalga oshiriladi. Avtomatlashtirishda eng murakkab protsedura - bu sanoat korxonalari, firmalar va boshqalarni boshqarish jarayonlari bo'lib, ularda yig'ish amalga oshiriladi va ob'ektning ishlab chiqarish-xo'jalik faoliyatini aks ettiradi. Ushbu protsedura pul mablag'lari oqimi ro'yxatga olingan moliya organlarida ham murakkab emas. Birlamchi buxgalteriya ma'lumotlarini maxsus ro'yxatga olish, ishonchliligi, birlamchi ma'lumotlarning o'z vaqtida to'liqligi muhimligiga qaratiladi. Xo'jalik operatsiyalari to'g'risidagi ma'lumotlarni ro'yxatdan o'tkazish uchun (tayyor mahsulotni qabul qilish, materiallarni qabul qilish va chiqarish va boshqalar), banklarda - yuridik va jismoniy shaxslar bilan moliyaviy-kredit operatsiyalarini amalga oshirishda. Buxgalteriya ma'lumotlari ish joylarida ishlov beriladigan qismlar sonini hisoblash, yig'ish moslamalari, mahsulotlarni yig'ish, nuqsonlarni aniqlash va boshqalar natijasida paydo bo'lishi mumkin. faktik ma'lumotlarni to'plash jarayonida, moddiy ob'ektlarni o'lchash, sanash, tortish, banknotlarni sanash, har bir ijrochining ishiga vaqt va miqdoriy tavsiflarni olish amalga oshiriladi. Ma'lumotlar to'plami odatda qayd etiladi, ya'ni. ma'lumotlar kompyuterga kirish orqali ma'lumot vositasida (hujjat, mashina muhiti) qayd qilinadi. Dastlabki hujjatlarda qayd etish asosan qo'lda amalga oshiriladi, shuning uchun yig'ish va ro'yxatga olish protseduralari ko'p vaqt talab etadi va ish jarayonini avtomatlashtirish jarayoni hamon dolzarb bo'lib qolmoqda. Korxonalarni boshqarishni avtomatlashtirish sharoitida ma'lumotlarni yig'ish va ro'yxatdan o'tkazish, ma'lumotni ro'yxatdan o'tkazish, to'plash va aloqa kanallari orqali uzatish, kerakli hujjatlarni yoki korxonani shakllantirish uchun to'g'ridan-to'g'ri kompyuterga kiritish uchun texnik vositalardan foydalanishga alohida e'tibor qaratiladi, bu korporativ o'lchovlarni to'plash va to'plash operatsiyalarini birlashtirishda sodir bo'ladi. tizimdagi ma'lumotlar. Ob'ektlarning ma'lumotlar bazalari standartlashtirishning etishmasligidan aziyat chekdi: standartlar ODMG tomonidan aniqlangan bo'lsa ham, ular hech qachon amalga oshirilmadi.
Mahsulotlar o'rtasidagi muvofiqlikni ta'minlash uchun etarlicha yaxshi. Shunga qaramay, ob'ektlar ma'lumotlar bazalari texnik ma'lumotlar bazalari yoki molekulyar biologiya ma'lumotlar bazalari kabi ko'plab keng tarqalgan ixtisoslashgan dasturlarda muvaffaqiyatli ishlatilgan. Biroq, ob'ektlar ma'lumotlar bazasi g'oyalari aloqador sotuvchilar tomonidan qabul qilindi va ushbu mahsulotlarga qilingan kengaytmalarga va haqiqatan ham SQL tiliga ta'sir ko'rsatdi. Ob'ektlar va o'zaro bog'liq ma'lumotlar bazalari o'rtasida o'tishning alternativasi ob'ektga nisbatan xaritalash (ORM) kutubxonasidan foydalanish hisoblanadi. Ma'lumotlar ombori - bu tashkilotda qaror qabul qilishni qo'llab-quvvatlash uchun hisobotlarni tayyorlash va biznesni tahlil qilish uchun maxsus ishlab chiqilgan, mavzuga yo'naltirilgan ma'lumot bazasi. U ma'lumotlar bazasini boshqarish tizimlari va qarorlarni qo'llab-quvvatlash tizimlari asosida qurilgan. Ma'lumotlar omboriga kiradigan ma'lumotlar odatda faqat o'qish uchun mo'ljallangan. OLTP tizimidan olingan ma'lumotlar ma'lumotlar omboriga shunday ko'chiriladi, bunda hisobotlarni tuzishda va OLAP tahlilida tranzaksiya tizimining resurslaridan foydalanilmaydi va uning barqarorligi buzilmaydi. Omborda ma'lumotlarni yangilashning ikkita varianti mavjud: ombordagi ma'lumotlarni to'liq yangilash. Birinchidan, eski ma'lumotlar o'chiriladi, keyin yangi ma'lumotlar yuklanadi. Jarayon muntazam ravishda amalga oshiriladi, bunda ma'lumotlarning ahamiyati OLTP tizimidan biroz orqada qolishi mumkin; bosqichma-bosqich yangilanish - faqat OLTP tizimida o'zgartirilgan ma'lumotlar yangilanadi. Repozitoriyani muammoli mavzularga yo'naltirishni tashkil qilish tamoyillari. Ma'lumotlar ular ishlatadigan dasturlarga emas, balki ularni tavsiflagan sohalarga ko'ra tasniflanadi va saqlanadi. Integratsiya. Ma'lumotlar shunchaki korxonaning barcha funktsiyalariga emas, balki umuman korxonaning barcha talablariga javob beradigan tarzda yig'iladi. Noto'g'ri. Ma'lumotlar omboridagi ma'lumotlar yaratilmaydi: ya'ni tashqi manbalardan keladi, tuzatilmaydi yoki o'chirilmaydi. Vaqtga bog'liqlik. Ombordagi ma'lumotlar aniq va aniqdir, agar ular ma'lum bir davrga yoki lahzaga bog'liq bo'lsa. Ma'lumotlar omborlarining dizayni ikkita asosiy arxitektura yo'nalishi mavjud - normallashtirilgan ma'lumotlar omborlari va o'lchamlari bo'lgan omborlar. Normallashtirilgan yo'naltirilgan uchinchi normal shakl jadvallarida. Normallashtirilgan omborlar oson tashkil etilishi va boshqarilishi bilan tavsiflanadi, normalizatsiya qilingan omborlarning kamchiliklari normallashtirishning natijasidir, buning natijasida omborlarda biron bir ma'lumot olish uchun ma'lumotlar ko'p sonli jadvallarga tortilishi kerak. Bir vaqtning o'zida ko'plab jadvallardan birini tanlashingiz kerak, bu tizimning ishlashida buzilishlarga olib keladi. Ushbu muammoni hal qilish uchun markazlashtirilmagan jadvallar qo'llaniladi - ma'lumotlar martsatlari, ularning asosida hisobot shakllari allaqachon ko'rsatiladi. Juda katta miqdordagi ma'lumotlar bilan "ma'lumotlar martsiyasi" / "saqlash" ning bir necha darajalaridan foydalanish mumkin. "Qor parchasi" bilan suzish. Bunday holda, ma'lumotlar (faktlar jadvali) "yulduz" markazida joylashgan va o'lchovlar yulduz nurlarini hosil qiladi. Turli xil faktlar jadvallari o'lchov jadvallarini bir-biriga ulashadi, bu esa bir nechta mavzular jadvallari ma'lumotlarini birlashtirishni osonlashtiradi (masalan, sotish va etkazib berish faktlari). Ma'lumotlar jadvallari va tegishli o'lchovlar avtobus arxitekturasini tashkil qiladi. O'lchovlar ko'pincha uchinchi normal shaklda tuziladi, shu jumladan o'lchovlardagi o'zgarishlarni qayd etish uchun. O'lchovlarni saqlashning asosiy ustunligi - ishlab chiquvchilar va foydalanuvchilar uchun soddaligi va ravshanligi, shuningdek, ma'lumotlarni yanada samarali saqlash va rasmiylashtirilgan o'lchovlar tufayli ma'lumotlarga kirish osonlashadi va tezlashadi, ayniqsa murakkab tahlillar uchun. Asosiy kamchilik - ma'lumotlarni tayyorlash va yuklash, shuningdek, o'lchovlarni boshqarish va o'zgartirish kabi murakkab protseduralar. Etarlicha katta miqdordagi ma'lumotlar, yulduz va qor parchalari sxemalari o'lchamlarga qo'shilishda ishlashning yomonlashishiga olib keladi.
Ma'lumotlar manbalari bilan ishlash jarayonlari quyidagilar bo'lishi mumkin:
1. o'lchovlar "yulduz" yoki sxemadan foydalanadi. Tranzaktsiyalarni ro'yxatdan o'tkazishning an'anaviy tizimlari
2. Alohida hujjatlar birlashtirilgan format.
3. O'zgartirish - qaror qabul qilish uchun zarur bo'lgan so'rovni bajarish uchun maqbul shaklda ma'lumotlarni saqlash uchun tayyorlash.
4. Yuklash - yangi faktlarni qo'shish yoki mavjudlarini to'g'irlash yo'li bilan ma'lumotlarni atom rejimida saqlash. Tahlil - OLAP, Data Mining, xulosa hisobotlari.
5. Tahlil natijalarini taqdim etish. Ushbu ma'lumotlarning barchasi metadata lug'atida ishlatiladi. Ma'lumot manbai lug'atlari avtomatik ravishda metadata lug'atiga kiritilgan. Bundan tashqari, ularni keyinchalik uyg'unlashtirish uchun ma'lumotlar formatlarini, ma'lumotlarni to'ldirish chastotasini, vaqtga muvofiqligini tavsiflaydi.Metad ma'lumotlar lug'atining vazifasi ishlab chiqaruvchini ma'lumotlar manbalarini standartlashtirish zaruriyatidan ozod qilishdir.Ma'lumotlar omborini yaratish ma'lumot to'plash va qayta ishlashning mavjud tizimlariga zid bo'lmasligi kerak. O'z vaqtida olinishini ta'minlashi kerak metadata lug'ati asosida ma'lumotlarning yagona formatga o'tkazilishini ta'minlaydi. Ma'lumotlar omborining mantiqiy ma'lumotlari tarkibi ma'lumotlar manbalarining ma'lumotlar tuzilishidan sezilarli darajada farq qiladi. Samarali konvertatsiya qilish jarayonini rivojlantirish uchun yaxshi ishlab chiqilgan ma'lumotlarning modelini va qarorlar texnologiyasi modelini talab qiladi. Foydalanuvchi uchun o'lchov sifatida vaqt, narx yoki geografik mintaqadan foydalanish mumkin bo'lgan ko'p o'lchovli ma'lumotlar bazalarida ma'lumotlarni taqdim etish qulay.
Ma'lumotlar bazasidan ma'lumotlarni olishdan tashqari, ma'lumotni olish jarayoni foydalanuvchining axborot ehtiyojlariga muvofiq qaror qabul qilishda muhimdir. Foydalanuvchi nuqtai nazaridan ma'lumotlar bazasidan bilimlarni olish jarayonida quyidagi o'zgarishlarni hal qilish kerak: ma'lumotlar-ma'lumot-bilimga asoslangan echimlar.
Ma'ruza 14. Sodda Bayyes klassifikatori va axborotni ajratishni klassifikatsiyalash. Matn kategoriyasi, sodda Bayyes modeli va klassifikator prinsiplari. Matn tilini aniqlash strukturasi. Sodda Bayyes algoritmi.

Reja : 1. Matn kategoriyasi, sodda Bayyes modeli.


2. Matn tilini aniqlash strukturasi.
Matn kategoriyasi, sodda Bayyes modeli.
Ma'lumotlar bazasi - bu mustaqil ravishda materiallar (maqolalar, hisob-kitoblar, qarorlar, sud qarorlari va shunga o'xshash materiallar) ob'ektiv shaklda taqdim etilib, ushbu materiallarni elektron vositalar yordamida topish va ishlov berish uchun tizimlashtirilgan tizimlar to'plami. hisoblash mashinasi (ECM). Ko'pgina mutaxassislar "ma'lumotlar bazasi menejmenti tizimi" atamasi o'rniga "ma'lumotlar bazasi" atamasini noto'g'ri ishlatishda keng tarqalgan xatoni ta'kidlaydilar va ushbu tushunchalarni farqlash zarurligini ta'kidlaydilar. aksincha, ba'zi bir mualliflarning sub'ektiv fikri, ammo umuman qabul qilingan yagona tuzilma mavjud emas. Xalqaro standartlar va milliy standartlarning ta'riflari xalqaro asosida ishlab chiqilgan:
Ma'lumotlar bazasi - bu ma'lumotlar sxemasiga muvofiq saqlanadigan va ma'lumotlar modellashtirish vositalari qoidalariga muvofiq boshqariladigan ma'lumotlar to'plami. Ma'lumotlar bazasi - bu bir yoki bir nechta amaliy sohalarni qo'llab-quvvatlaydigan ushbu ma'lumotlarning xususiyatlari va ular o'rtasidagi munosabatlarni tavsiflovchi kontseptual tuzilishga muvofiq tashkil etilgan ma'lumotlar to'plami. Ma'lumotlar bazasi - bu ma'lum qoidalarga muvofiq tashkil etilgan va kompyuter xotirasida saqlanadigan, ma'lum bir fan sohasining hozirgi holatini tavsiflaydigan va foydalanuvchilar tomonidan ishlatiladigan ma'lumotlar to'plami. Ma'lumotlar bazasi - bu har qanday turdagi dasturiy ta'minot tizimlari tomonidan korxonaning axborot ehtiyojlarini qondirish uchun foydalanadigan doimiy (doimiy saqlanadigan) ma'lumotlar to'plami. Ma'lumotlar bazasi - bu

tashkilotning axborot ehtiyojlarini qondirish uchun ishlab chiqilgan mantiqiy bog'liq ma'lumotlarning umumiy to'plami (va bu ma'lumotlar tavsifi)! "Ko'pincha (aniq yoki ravshan) ta'riflar quyidagi o'ziga xos xususiyatlarga ega: ma'lumotlar bazasi kompyuterda saqlanadi va qayta ishlanadi. , har qanday kompyuterdan tashqari saqlash ma'lumotlari (arxivlar, kutubxonalar, saqlash kabinetlari va boshqalar) ma'lumotlar bazasi emas 1. Ma'lumotlar bazasida ma'lumotlar ularni raqamli tizimda samarali qidirish va qayta ishlash imkoniyatini ta'minlash uchun mantiqiy tuzilgan (tizimlashtirilgan). Tarkibiy qismlarni (elementlarni), ular orasidagi ulanishlarni aniqlash, shuningdek ba'zi bir semantika va ruxsat etilgan operatsiyalar element turiga (ulanish) bog'liq bo'lgan elementlar va ulanishlarni identifikatsiya qilish. 3. Ma'lumotlar bazasi mantiqiy tuzilishini rasmiy shaklda tavsiflovchi sxema yoki metadata o'z ichiga oladi. ba'zi metamodellarga ko'ra) GOST R ISO ga muvofiq MEC 10032-2007, "Ma'lumotlar bazasi muhitidagi doimiy ma'lumotlar sxema va ma'lumotlar bazasini o'z ichiga oladi. Sxema ma'lumotlar bazasini yaratish va saqlash uchun ishlatiladigan tarkib, tuzilish va yaxlitlik cheklovlarining tavsiflarini o'z ichiga oladi. Ma'lumotlar bazasi sxema yordamida aniqlangan doimiy ma'lumotlar to'plamini o'z ichiga oladi. Ma'lumotni boshqarish tizimi sxemadagi ma'lumotlar ta'riflaridan foydalanadi va ma'lumotlar bazasiga kirishni boshqarish uchun ruxsat beradi! Ro'yxatda keltirilgan xususiyatlardan faqat birinchisi qat'iy, boshqalari esa har xil talqinlarni va turli darajalarni tan olishadi. Siz faqat ma'lumotlar bazasi talablariga muvofiqligini aniqlay olasiz. Bunday vaziyatda umumiy amaliyot muhim rol o'ynaydi. Shunga muvofiq, masalan, fayl arxivlari, Internet-portallar yoki elektron jadvallar, ular joylashganligiga qaramay, ma'lumotlar bazasi deb nomlanmaydi.


Qaysidir ma'noda MB belgilariga ega Ko'pincha bu daraja etarli emasligi tan olinadi (garchi istisnolar bo'lsa ham). Tarix Ma'lumotlar bazasi texnologiyalarining paydo bo'lishi va rivojlanishi tarixi keng va tor tomonlarida ko'rib chiqilishi mumkin. Ma'lumotlar bazalari tarixi tushunchasi keng ma'noda, insoniyat ma'lumotlarni saqlagan va qayta ishlagan har qanday vositalar tarixi bilan umumiydir. Shu nuqtai nazardan, masalan, qadimgi Shumerda qirollik xazinasi va soliqlarini hisobga olish usullari, mil. Avv. 4000 yilda, Incalar - kipu, yozuvlari Ossuriya podsholigi hujjatlarini o'z ichiga olgan mixxalar va hokazolar haqida eslatib o'tilgan. "ma'lumotlar bazasi" tushunchasini xiralashtirish va aslida uni "arxiv" va hatto "yozish" tushunchalari bilan birlashtirish. Ma'lumotlar bazalarining tarixi an'anaviy (zamonaviy) tushunchada. 1955 yilda yozuvni qayta ishlash uchun dasturiy ta'minot paydo bo'ldi. Bu vaqtning dasturiy ta'minoti fayllarga asoslangan yozuvlarni qayta ishlash modelini qo'llab-quvvatladi. Punch kartalari ma'lumotlarni saqlash uchun ishlatilgan. Onlayn onlayn ma'lumotlar bazalari 1960 yillarning o'rtalarida paydo bo'ldi. Operatsion ma'lumotlar bazasidagi operatsiyalar terminallar yordamida interaktiv ravishda qayta ishlandi. Oddiy indeksli ketma-ket ro'yxatga olish tashkilotlari tezda kuchli yo'naltirilgan yozuvlar modeliga o'tdilar. Charlz Baxman ma'lumotlar bazasi va ma'lumotlarni boshqarish uchun standart tilni ishlab chiqqan Data Base Task Group (DBTG) rahbarligi uchun Turing mukofotiga sazovor bo'ldi. Shu bilan birga, Cobol ma'lumotlar bazasi jamoasida ma'lumotlar bazasi sxemalari va ma'lumotlar mustaqilligi tushunchasi ishlab chiqilgan. Keyingi muhim bosqich Edgar Coddning ishi tufayli relyatsion ma'lumotlar modelining 70-yillarning boshlarida paydo bo'lishi bilan bog'liq. Codd ishi amaliy ma'lumotlar bazasi texnologiyasi va matematika va mantiq o'rtasidagi yaqin aloqani yo'lga qo'ydi. Edgar F. Codd shuningdek nazariya va amaliyotga qo'shgan hissasi uchun Tyuring mukofotiga sazovor bo'ldi. Ma'lumotlar bazasi o'zi 1960 yillarning boshlarida paydo bo'lgan va 1964 va 1965 yillarda SDC tomonidan tashkil qilingan simpoziumlarda joriy etilgan, garchi dastlab bu tushuncha tor ma'noda sun'iy intellekt tizimlari nuqtai nazaridan tushunilgan bo'lsa ham. Ushbu atama zamonaviy ma'noda faqat 70-yillarda keng qo'llanila boshladi. Ma'lumotlar bazalarining turlari - Mavjud ma'lumotlar bazasi mezonlardan boshlanadigan ma'lumotlar bazasini tor ma'noda ko'rib chiqadi. Masalan, "Ma'lumotlar bazasi texnologiyalarining entsiklopediyasi" ma'lumotlarida ushbu bo'limda yozilgan ma'lumotlar bazalarida 50 dan ortiq ma'lumotlar bazalari aniqlangan. Asosiy tasniflash quyida ko'rsatilgan. Ma'lumotlar modeliga ko'ra tasniflash. Misollar: Ierarxik turlicha 51/59 Ob'ektga va ob'ektga yo'naltirilgan Ob'ekt-Relational Relational Network funktsional. Doimiy saqlash muhitiga ko'ra tasniflash Ikkilamchi xotirada yoki an'anaviy (inglizcha odatiy ma'lumotlar bazasi): doimiy saqlash muhiti periferik uchmaydigan xotira (ikkinchi darajali xotira) - odatda qattiq disk. DBMS faqat operativ xotiraga joriy ishlov berish uchun kesh va ma'lumotlarni joylashtiradi. Xotirada (xotirada saqlanadigan ma'lumotlar bazasi, xotira rezidentlari bazasi, asosiy xotira bazasi): bajarilish bosqichidagi barcha ma'lumotlar operativ xotirada joylashgan. Uchinchi ma'lumotlar bazasi: Doimiy saqlash vositasi odatda magnit tasmalar yoki optik disklarga asoslangan serverdan ajratiladigan ommaviy saqlash moslamasi (uchinchi darajali xotira). Serverning ikkinchi darajali xotirasi faqat uchinchi darajali xotira ma'lumotlari katalogini, fayl keshini va joriy ishlov berish uchun ma'lumotlarni saqlaydi; ma'lumotlarni o'zi yuklash maxsus protsedurani talab qiladi. Tarkibni tasniflashga misollar: Geografik tarixiy ilmiy multimedia mijozi. Tarqatish darajasi bo'yicha tasniflangan (markazlashtirilgan yoki inglizcha inglizcha ma'lumotlar bazasi): ma'lumotlar bazasi bitta kompyuterda to'liq qo'llab-quvvatlanadi. Taqsimlangan ma'lumotlar bazasi - tarkibiy qismlari ba'zi bir mezonlarga muvofiq kompyuter tarmog'ining turli tugunlarida joylashgan. Geterogenli taqsimlangan ma'lumotlar bazasi: turli xil tarmoq tugunlarida taqsimlangan ma'lumotlar bazasining bo'laklari bir nechta DBMS homogen (eng.homogeneous di stributlangan ma'lumotlar bazasi) tomonidan qo'llab-quvvatlanadi: turli tarmoq tugunlarida taqsimlangan ma'lumotlar bazalari qismlari bir xil DBMS fraqmentlangan yoki qismli ma'lumotlar bazasi: ma'lumotlarni tarqatish usuli qismlarga ajratish (bo'linish, bo'linish), vertikal yoki gorizontal. Replikatsiya qilingan ma'lumotlar bazasi: ma'lumotlarni tarqatish usuli - bu replikatsiya (replikatsiya).
Boshqa turdagi ma'lumotlar bazalari Fazoviy ma'lumotlar bazasi: domen ob'ektlarining fazoviy xususiyatlarini saqlaydigan ma'lumotlar bazasi. Bunday ma'lumotlar bazalari geografik axborot tizimlarida keng qo'llaniladi. Vaqtinchalik yoki vaqtinchalik (inglizcha temporal ma'lumotlar bazasi): foydalanuvchi tomonidan belgilangan vaqtni hisobga olmaganda, vaqtning har qanday tomoni qo'llab-quvvatlanadigan ma'lumotlar bazasi. Mekansal-vaqtinchalik ma'lumotlar bazasi: Bir vaqtning o'zida bir yoki bir nechta o'lchamdagi ma'lumotlar makon va vaqt nuqtai nazaridan qo'llab-quvvatlanadigan ma'lumotlar bazasi. Cyclic (inglizcha go-robin ma'lumotlar bazasi): ma'lumotlar bazasi, vaqt o'tishi bilan o'zgarmaydigan saqlanadigan ma'lumotlar miqdori, chunki yangi ma'lumotlarni saqlash jarayonida ular eski ma'lumotlarning o'rnini bosadilar. Xuddi shu ma'lumotlar hujayralari davriy ravishda ishlatiladi. Juda katta ma'lumotlar bazasi (VLDB) bu juda katta miqdordagi jismoniy saqlash joyini egallaydigan ma'lumotlar bazasi. Ushbu atama biz jismoniy ma'lumotlarni saqlash texnologiyalari va dasturiy ta'minotni boshqarish texnologiyalarining eng so'nggi yutuqlari bilan belgilanadigan biz mumkin bo'lgan maksimal ma'lumotlar bazasini anglatadi. Vaqt o'tishi bilan "juda katta hajm" ning miqdoriy ta'rifi o'zgaradi. Shunday qilib, 1997 yilda dunyodagi eng katta matnlar bazasi K terri Ridderning 7 terabayt hajmli DIALOG dasturi edi. 2001 yilda eng katta ma'lumotlar bazasi 10,5 terabayt, 2003 yilda 25 terabayt bo'lgan. 2005 yilda dunyodagi eng katta ma'lumotlar bazalari yuz terabaytni saqlash imkoniyatiga ega deb hisoblanadi. 2006 yilda Google qidiruv tizimi 850 terabayt ma'lumotlar bazasidan foydalangan. 2010 yilga kelib, ulkan katta ma'lumotlar bazasining hajmini kamida petabaytlar bilan o'lchash kerak deb hisoblangan. 2011 yilda Facebook ma'lumotlarini umumiy sig'imi 21 petabayt bo'lgan 2 mingta tugunlardan iborat to'plamda saqlagan, 2012 yil oxiriga kelib, Facebook ma'lumotlari hajmi 100 petabaytga etgan, 2014 yilda esa, bilvosita hisob-kitoblarga ko'ra, Google o'z serverlarida 10-15 ekzabaytgacha saqlagan. umumiy ma'lumot. Ba'zi ma'lumotlarga ko'ra, 2025 yilga kelib, genetika bo'yicha mutaxassislar 100 milliondan 2 milliardgacha bo'lgan odamlarning genlari to'g'risida ma'lumotlarga ega bo'ladilar va bu ma'lumotni saqlash uchun 2 dan 40 ekzabaytgacha vaqt ketadi. Umuman olganda, IDC hisob-kitoblariga ko'ra, "raqamli olam" dagi ma'lumotlar har ikki yilda ikki baravar ko'paymoqda va 2013 yildagi 4,4 zattabaytdan 2020 yilda 44 zettabaytgacha o'zgaradi. Ultra katta VLDB ma'lumotlar bazalarini saqlash va qayta ishlash bo'yicha tadqiqotlar doimo ma'lumotlar bazasi nazariyasi va amaliyotining etakchi qismidir. Jumladan, 1975 yildan beri har yili juda katta ma'lumotlar bazasi bo'yicha xalqaro konferentsiya o'tkazib kelinmoqda (“300 petabayt bo'yicha xalqaro konferentsiya).
Tadqiqotlarning aksariyati VLDB Endowment notijorat tashkiloti homiyligida olib borilmoqda, u ilmiy ishlarni qo'llab-quvvatlaydi va ulkan yirik ma'lumotlar bazasida va tegishli sohalarda ma'lumot almashadi.



Download 225.96 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling