Ma'ruza Kirish. Axborotlarni izlash va ajratib olish tushunchalari. Axborotlarni izlash va ajratish xaqida asosiy tushunchalar. Axborotlarni ajratish va izlashning nazariy mezonlari. Axborot izlash strategiyasini loyihalash bosqichlari


Ma'ruza 10. Relevant alokalardan foydalanish va so‘rovlarni kengaytirish


Download 225.96 Kb.
bet7/9
Sana25.04.2023
Hajmi225.96 Kb.
#1398325
1   2   3   4   5   6   7   8   9
Bog'liq
Ma\'ruza Kirish. Axborotlarni izlash va ajratib olish tushunchala

Ma'ruza 10. Relevant alokalardan foydalanish va so‘rovlarni kengaytirish.
Relevant aloqalarning funksyalari. Qidiruv so‘rovlarni kengaytirish parametrlari. Relevant aloqalarning usullari va algoritmlari.

Reja: 1. Qidiruv so‘rovlarni kengaytirish parametrlari.


2. Relevant aloqalarning usullari va algoritmlari.
Qidiruv so‘rovlarni kengaytirish parametrlari.
Ma'lumotlar qidirish sohasi 1989 yilda Grigoriy Pyatetskiy-Shapiro tomonidan o'tkazilgan seminar bilan boshlangan. Grigoriy Pyatetskiy-Shapiro savol bilan qiziqdi: ba'zi bir so'rovlarni yirik ma'lumotlar bazalariga tezlashtirish uchun avtomatik ravishda aniq qoidalarni topish mumkinmi? Shu bilan birga, ikkita atama taklif qilindi - ma'lumotlar qidirish ("ma'lumotlar ishlab chiqarish") va ma'lumotlardagi bilimlarni ochish ("ma'lumotlar bazasida bilimlarni ochish" deb tarjima qilinishi kerak). 1993 yilda birinchi Kpowledge Discovery Nuggets axborot byulleteni chiqarildi va 1994 yilda ma'lumot ishlab chiqaradigan saytlardan biri yaratildi. Muammolar to'g'risida bayonot Dastlab, muammo quyidagicha qo'yiladi: juda katta ma'lumotlar bazasi mavjud; ma'lumotlar bazasida ba'zi "yashirin bilimlar" mavjud deb taxmin qilinadi. Katta hajmdagi xom ma'lumotlarda yashirin bo'lgan bilimlarni aniqlash usullarini ishlab chiqish kerak. Hozirgi global raqobat sharoitida, GTE laboratoriyalarida ishlashda qo'shimcha raqobatdoshlik manbai bo'lishi mumkin bo'lgan aniqlangan bilimlar (bilimlar). "Yashirin bilim" nimani anglatadi? Bu, albatta, bilim bo'lishi kerak: ilgari noma'lum, ya'ni yangi bo'lishi kerak bo'lgan bilim (va ilgari olingan ma'lumotni tasdiqlamagan); trivial emas - bu shunchaki ko'rinmaydigan narsalar (ma'lumotlarni to'g'ridan-to'g'ri vizual tahlil qilish bilan yoki oddiy statistik tavsiflarni hisoblashda); amaliy jihatdan foydali - ya'ni tadqiqotchi yoki iste'molchi uchun qadrli bo'lgan bilimlar; sharhlash uchun qulay - ya'ni foydalanuvchi uchun vizual ko'rinadigan va mavzu doirasi bo'yicha tushuntirish oson bo'lgan bilimlar. Ushbu talablar ma'lumotlar qidirish usullarining mohiyatini va ma'lumotlar yig'ish texnologiyasida ma'lumotlar bazasini boshqarish tizimlari, statistik tahlil usullari va sun'iy intellekt usullaridan qaysi shaklda va qaysi nisbatda foydalanilishini aniqlaydi. Ma'lumotlar qidirish va ma'lumotlar bazalari Ma'lumotlarni qidirish usullari katta ma'lumotlar bilan ishlashda ham, nisbatan kam miqdordagi ma'lumotlarni qayta ishlashda ham qo'llanilishi mumkin (masalan, individual eksperimentlar natijalari natijasida yoki kompaniya faoliyati to'g'risidagi ma'lumotlarni tahlil qilishda) 1322 kun ko'rsatilmagan). , Etarli miqdordagi ma'lumotlarning mezoni sifatida ikkala tadqiqot sohasi ham ko'rib chiqiladi va tahlil algoritmi ishlatilmaydi 1322 kun.] Ma'lumotlar bazasi texnologiyalarining rivojlanishi avval ma'lumotlar bazalari uchun so'rovlar tilini yaratishga olib keldi. Ixtisoslashgan til uchun - relyatsion ma'lumotlar bazasi - bu SQL tilini keng taqdim etdi.
Keyin analitik ma'lumotlarni (masalan, ma'lum bir davrdagi korxona faoliyati to'g'risida ma'lumot) olish zarurati paydo bo'ldi, shundan so'ng ma'lumotlar bazasi yaxshi moslangan, korxonalar, tahlil qilish uchun kam moslangan bo'lib chiqdi. Bu, o'z navbatida, deb atalmish tashkilotni yaratishga olib keldi. "Ma'lumotni saqlash", uning tuzilishi eng yaxshi matematik tahlildir. Ma'lumotlarni qidirish va sun'iy aql. Ma'lumotlar qidirish usullari orqali olingan bilimlar odatda qonuniyatlar (naqshlar) shaklida taqdim etiladi. Bular: an'anaviy an'anaviy munosabatlar, masalan, operatsion hisobni uyushmaning keng qamrovli qoidalariga muvofiq tarzda o'tkazish uchun; qaror daraxtlari; klasterlar; matematik funktsiyalar. Bunday naqshlarni topish algoritmlari maydonlar chorrahasida joylashgan: Sun'iy intellekt, matematik statistika, matematik dasturlash, vizualizatsiya, OLAP. Ma'lumotlar qidirish usullari bilan hal qilingan muammolar odatda tavsifiy va bashoratli muammolarga bo'linadi. Ta'rif muammolarida, eng muhimi, mavjud yashirin naqshlarning vizual tavsifini berishdir, bashoratli muammolarda ma'lumotlar hali mavjud bo'lmagan holatlar uchun bashorat qilish masalasi birinchi o'rinda turadi. Tasviriy vazifalarga quyidagilar kiradi: birlashma qoidalari yoki naqshlarini (naqshlarini) topish%; ob'ektlarni guruhlash, klaster tahlili; regressiya modelini qurish. Bashoratli vazifalarga quyidagilar kiradi: ob'ektlarni tasniflash (oldindan belgilangan sinflar uchun); regressiya tahlili, vaqt seriyasini tahlil qilish.
Ma'ruza 11. Tartibli indeks modeli, usul va algoritmlari. Tartibli indeks tushunchasi. Axborot izlash tizimlarini tartibli indeksi. Axborot izlash va ajratishda indeks usullari algoritmlari.

Reja : 1. Axborot izlash tizimlari.


2. Axborot izlash va ajratishda indeks usullari algoritmlari.
Axborot izlash tizimlari.
Tasniflash muammolari "boshqariladigan o'rganish" bilan tavsiflanadi, unda modelni qurish (o'qitish) kirish va chiqish vektorlarini o'z ichiga olgan namunada amalga oshiriladi. Klasterlash va birlashtirish vazifalari uchun "nazorat qilinmagan o'rganish" ishlatiladi, unda model chiqish parametrlarini o'z ichiga olmaydigan namunadan foydalangan holda quriladi. Chiqish parametrining qiymati ("klasterni anglatadi ..", "vektorga o'xshaydi ...") o'quv jarayonida avtomatik ravishda tanlanadi. Kirish va chiqish vektorlariga bo'linishning yo'qligi tavsifni qisqartirish muammolariga xosdir.
O'qitish bosqichlari - ma'lumotlarni qidirish usullari yordamida muammolarni hal qilishning bir qator bosqichlari:
1. Tahlil muammosini bayon qilish;
2. Ma'lumotlar to'plash;
3. Ma'lumotlarni tayyorlash (filtrlash, qo'shish, kodlash);
4. Modelni tanlash (ma'lumotlarni tahlil qilish algoritmi)%;
5. Model parametrlari va o'rganish algoritmini tanlash;
6. Modelni o'qitish (boshqa model parametrlarini avtomatik izlash);
7. Agar 5-bandga yoki 4-bandga o'tish qoniqarli bo'lmasa, o'qitish sifatini tahlil qilish% 3
8. Agar 1, 4 yoki 5-bandlarga o'tish zarur bo'lsa, aniqlangan naqshlarni tahlil qilish ma'lumotni tayyorlash algoritmlaridan foydalanishdan oldin, to'plamni tayyorlash kerak. IAD faqat ma'lumotlarda mavjud bo'lgan naqshlarni aniqlay oladiganligi sababli, bir tomondan, dastlabki ma'lumotlar ushbu naqshlar ularda mavjud bo'lishi uchun etarli hajmga ega bo'lishi kerak, boshqa tomondan esa tahlil uchun maqbul vaqtni olish uchun etarlicha ixcham bo'lishi kerak. Ko'pincha ma'lumotlar omborlari yoki ma'lumotlar shpallari manba ma'lumotlari sifatida ishlaydi. Klasterlash yoki ma'lumotni ishlab chiqarishdan oldin ko'p o'lchovli ma'lumotlarni tahlil qilish uchun tayyorgarlik zarur. Keyin ma'lumotlar filtrlanadi. Filtrlash shovqin va etishmayotgan ma'lumotlar bilan namunalarni olib tashlaydi. Filtrlangan ma'lumotlar xususiyatlar to'plamiga (yoki vektorlarga, agar algoritm faqat sobit o'lchovli vektorlar bilan ishlashi mumkin bo'lsa) kamayadi, bitta kuzatishda bitta xususiyat. Xususiyatlar to'plami xom ma'lumotlarning xususiyatlari talab qilinadigan ishlov berish asosida yuqori taxminiy kuchga ega bo'lgan farazlarga muvofiq shakllantirilgan. Masalan, 100x100 pikselli yuzning oq-oq rangli tasviri 10 ming bit ma'lumotni o'z ichiga oladi. Ularni ko'zlar va og'izning tasvirida aniqlashga aylantirish mumkin. Natijada, ma'lumotlar miqdori 10 ming bitdan pozitsiya kodlari ro'yxatiga kamayadi, tahlil qilinadigan ma'lumotlar miqdorini va shu sababli tahlil vaqtini sezilarli darajada kamaytiradi. Bir qator algoritmlar bashoratli kuchga ega (masalan, ma'lum bir turning etishmasligi). Birlashma qoidalari usulidan foydalanganda ayting (rus). xususiyat vektorlari ishlov berilmaydi, lekin o'zgaruvchan o'lchovlar to'plami.
Maqsadli funktsiyani tanlash, tahlil qilishning maqsadi bo'lgan Xaridorlar sotib olgan holda, yo'qolgan ma'lumotlarni qayta ishlash imkoniyatiga ega bo'lish orqali xususiyatlar vektorining kardinalligiga bog'liq bo'ladi; Ma'lumotni muvaffaqiyatli olish uchun "to'g'ri" funktsiyani tanlash muhim hisoblanadi. Kuzatuvlar ikki toifaga bo'linadi - o'quv to'plami va testlar to'plami. O'quv to'plami ma'lumotni ishlab chiqarish algoritmini "o'qitish" uchun ishlatiladi va test to'plami topilgan naqshlarni tekshirish uchun ishlatiladi.
Axborotni ajratib olish - bu strukturalanmagan yoki yarim tuzilgan mashina tomonidan o'qiladigan hujjatlardan avtomatik ravishda tarkibiy ma'lumotlarni olish (qurish) vazifasi. tabiiy tilda matnni qayta ishlash bilan bog'liq ma'lumotlarni qidirish. Ma'lumot olishning misoli ish tashriflarini izlash bo'lishi mumkin - rasmiy ravishda shunday yozilgan: MadeVisit (Company-Kim, Company-Kim, DateVisit) - yangiliklar lentalarida: "Kecha, 2007 yil 1 aprelda Pepelats International Corporation vakillari transformatsion idoraga tashrif buyurishdi. - ma'lumotlarni qayta ishlashning standart usullaridan foydalangan holda ma'lumotlar. Tor maqsad, masalan, matnda tasvirlangan hodisalarda mantiqiy naqshlarni aniqlash vazifasi bo'lishi mumkin. Zamonaviy axborot texnologiyalarida, ma'lumotni yig'ish kabi protseduralarning roli tobora o'sib bormoqda, chunki tuzilmagan (metadata bo'lmagan) ma'lumotlar, xususan Internetda. Ushbu ma'lumotni uni relatsion shaklga o'tkazish yoki XML belgisini qo'shish orqali yanada tuzilishi mumkin. Aqlli agentlar yordamida yangiliklar tasmalarini kuzatishda axborotni olish va uni keyinchalik ishlash uchun qulayroq bo'lgan shaklga o'tkazish usullari talab qilinadi. Ma'lumotni izlashning odatiy vazifasi tabiiy tilda yozilgan hujjatlar to'plamini skanerlash va ma'lumotlar bazasini ta'kidlangan foydali ma'lumotlar bilan to'ldirishdir. Zamonaviy axborotni yig'ish usullari tabiiy tillarni qayta ishlash usullaridan foydalanadi va o'ziga xos tortishish mahsulotidir. "Xaotik" kompaniyaning asosiy maqsadi dastlab cheklangan mavzular (savollar, muammolar) bo'yicha tahlil qilish qobiliyatidir - ko'pincha faqat bitta mavzu bo'yicha. Masalan, Xabarni tushunish bo'yicha konferentsiya (MUC) raqobatbardosh konferentsiya bo'lib, ilgari quyidagi mavzularga bag'ishlangan: MUC-1 (1987), MUC-2 (1989): Harbiy-dengiz operatsiyalari. MUC-3 (1991), MUC-4 (1992): FAQAT Lotin Amerikasi mamlakatlarida terrorizm. MUC-5 (1993): Mikroelektronikada venchur operatsiyalari. MUC-6 (1995): boshqarish jarayonlaridagi o'zgarishlar haqidagi yangiliklar. MUC-7 (1998): Sun'iy yo'ldoshni ishga tushirish bo'yicha hisobotlar. Tabiiy tillardagi matnlar kompyuter uchun tushunarli bo'lgan tilga (masalan, RDF - Resurslarni tavsiflash asoslari) ba'zi tarjimalarni talab qilishi mumkin. Axborot olishning odatiy pastki qismlari: nomlangan elementlarni (ob'ektlarni) aniqlash, masalan: odamlarning ismlari, tashkilotlar nomlari, geografik nomlar, voqealar, vaqt va pul belgilari va boshqalar.
Anafora va asosiy kamchiliklarni hal qilish: Xuddi shu ob'ekt bilan bog'liq munosabatlarni qidiring. Bunday murojaatlarning odatiy holati pronominal anafora. Belgilangan terminologiya: berilgan matn uchun kalit so'zlar va iboralarni topish (taqsimlash). Avtoreferat: matndan semantik, hissiy, baholash va boshqa ma'lumotlarni tanlash. Bu generativ va deklarativ bo'lishi mumkin. MA'LUMOTNI OShIRISh Ma'lumot olishda ma'lumotlarni qidirishning turli shakllari va usullari muhim ahamiyatga ega:. har qanday hodisani bog'lash bilan bog'liq bo'lgan uyushmalarni qidirish; ... vaqt ichida voqealar ketma-ketligini aniqlash3; o'rganilayotgan ob'ekt (vaziyat, jarayon) ning bilvosita parametrlarini aniqlash qiymatlari o'rtasidagi bog'liqlik orqali ma'lumotlar to'plamidagi yashirin naqshlarni aniqlash; ... vaziyatning rivojlanishiga parametrlarning ahamiyatini (ta'sirini) baholash; Ob'ektni (hodisalarni, holatlar, jarayonlar) muayyan toifaga kiritish mumkin bo'lgan mezonlarni qidirish orqali amalga oshiriladigan tasniflash (tan olish); ... ob'ektlarni har qanday sabab-oqibat xususiyatlariga ko'ra guruhlash asosida klasterlash; ... voqealar va vaziyatlarni bashorat qilish. Ko'pgina fan sohalariga xos bo'lgan axborot manbalarining heterojenliligi (heterojenligi) haqida eslatib o'tish kerak. Ushbu muammoni hal qilish usullaridan biri hozirgi kunda eng keng tarqalgan ob'ektga yo'naltirilgan yondashuvdir. Keling, uning asosiy qoidalarini qisqacha ko'rib chiqaylik. Ob'ektga yo'naltirilgan yondashuv asosida dekompozitsiya quyidagi asosiy tushunchalarni tanlashga asoslangan: ob'ekt, sinf, misol. Ob'ekt - bu haqiqiy xususiyatlar va xatti-harakatlar qonunlariga ega bo'lgan ko'plab ob'ektlarning mavhumligi. Ob'ekt bunday ob'ektning tipik aniqlanmagan elementini tavsiflaydi.Obyektning asosiy xarakteristikasi (xususiyatlar) hisoblanadi .Barcha qiymatlar. uning atributlarining tarkibi ob'ektlar, boshqalarning xususiyatlari esa maxsus tavsiflar bo'lib, ular orqali ob'ektlarning qoidalarini o'rnatishingiz mumkin. Ob'ektning namunasi avtoulovning avtoulov belgisi bo'lishi mumkin, va ushbu ob'ektning namunasi K 173 PA maxsus raqami bo'lishi mumkin. Sinf - bu umumiy tuzilish va xulq-atvor bilan bog'liq bo'lgan real dunyo ob'ektlarining to'plamidir. Sinf elementi bu berilgan to'plamning o'ziga xos elementidir. Masalan, transport vositalarini ro'yxatdan o'tkazish raqamlari klassi. Ushbu ta'riflarni umumlashtirib, ob'ekt sinf vakili deb aytishimiz mumkin va "ob'ekt misoli" va "sinf elementi" atamalari to'plamning o'ziga xos elementidir.



4-rasm. Sinflar, ob'ektlar va real dunyo narsalari o'rtasidagi munosabatlar


Ob'ektga yo'naltirilgan yondashuvning muhim xususiyati ma'lumotlar va usullarni (ob'ekt bilan xatti-harakatlar) ob'ektning o'z resurslari sifatida yashirishni anglatadigan encapsulation tushunchasi bilan bog'liq. Polimorfizm va meros tushunchalari ob'ektga yo'naltirilgan tizimning evolyutsiyasini belgilab beradi, bu esa bazislarga asoslangan ob'ektlarning yangi sinflarini aniqlashni nazarda tutadi. Sinf tipik ob'ekti vakili Umumiy ob'ektlar va tuzilishga ega bo'lgan real dunyo ob'ektlari to'plami Odatda tipik - ma'lum bir ob'ektlar to'plamining noma'lum elementiga mos keladi Umumiy mavzuni belgilaydigan element | mavzu quyidagilardan iborat - Xulosa qiladi - Haqiqiy dunyo hodisasi Fig. 4. Haqiqiy dunyo sinflari, ob'ektlari va ob'ektlari o'rtasidagi munosabatlar Polimorfizm ob'ektning bir nechta turlarga tegishli bo'lish qobiliyati sifatida izohlanadi. Meros, bu ma'lumotlar va usullarni qo'shish yoki bekor qilish qobiliyatiga ega bo'lgan mavjud sinflar asosida yangi sinflarni aniqlash qobiliyatini anglatadi. ETL (inglizcha Extract, Transform, Load - so'zma-so'z "ajratib olish, o'zgartirish, yuklash") ma'lumotlar omborxonasi, quyidagilarni o'z ichiga oladi: tashqi manbalardan ma'lumotlarni olishni boshqarishdagi asosiy jarayonlardan biri; ularni biznes-model talablariga moslashtirish va o'zgartirish; va ularni ma'lumotlar omboriga yuklash. ETL jarayoni nuqtai nazaridan ma'lumotlar ombori arxitekturasini uchta tarkibiy qism shaklida ifodalash mumkin: ma'lumotlar manbai: jadval shaklida tuzilgan ma'lumotlar, jadvallar to'plami yoki shunchaki fayl (ma'lumotlarni ajratuvchi belgilar bilan ajratilgan ma'lumotlar); Tayyorlash maydoni: jadvallar, vaqtincha va faqat tushirish jarayonini tashkil qilish uchun tuzilgan. ma'lumotlar qabul qiluvchisi: qo'shimcha ma'lumotlar joylashtiriladigan ma'lumotlar ombori yoki ma'lumotlar bazasi.


Ma'lumotlarning manbadan yo'nalishga yo'naltirilganligi ma'lumotlar oqimi deb nomlanadi. Ma'lumot oqimining talablari tahlilchi tomonidan tavsiflanadi. ETL nafaqat ma'lumotni bitta dasturdan boshqasiga o'tkazish jarayoni, balki ma'lumotlarni tahlil qilish uchun tayyorlash vositasi sifatida ham ko'rib chiqilishi kerak.
Mundarija
1 Ma'lumotni ETL-ga chiqarish
2 Ma'lumotni o'zgartirish
3 Ma'lumotni yuklash
4 Ma'lumotni ETL-ga ajratib olish ETL jarayonidagi birinchi qadam ma'lumotlar manbalaridan yozuvlarni olish va ularni o'zgartirish jarayoniga tayyorlashdir.
Ma'lumotlar olish protsedurasini ishlab chiqishda birinchi qadam ma'lumotlarning OLTP tizimlaridan yoki alohida manbalardan qanchalik tez-tez yuklab olinishini aniqlashdir. Ma'lumotni yuklash ma'lum vaqtni oladi, bu "Yuklash oynasi" deb nomlanadi. Ma'lumotlar olish protsedurasi ikki shaklda amalga oshirilishi mumkin: ixtisoslashtirilgan dasturiy ta'minot yordamida ma'lumotlarni yig'ish; ular saqlanadigan tizim yordamida ma'lumotlarni qidirish. Ajratib bo'lgandan so'ng, ma'lumotlar "sahna maydoni" deb nomlangan joyga joylashtiriladi, bu erda har bir ma'lumot manbai o'z jadvalini yoki alohida faylni yoki ikkalasini yaratadi. Ma'lumotni o'zgartirish Ushbu bosqichning maqsadi ma'lumotlarni ma'lumotlar omboriga joylashtirish uchun tayyorlash va uni keyinchalik tahlil qilish uchun qulayroq shaklga keltirishdir. Bunda tahlilchi tomonidan qo'yilgan ba'zi talablarni, xususan, ma'lumotlar sifati darajasiga e'tibor berish kerak. Shu sababli, ma'lumotlarni qayta ishlash va tozalashning murakkab usullarini amalga oshiradigan oddiy qo'lda ma'lumotlarni tahrirlash vositalari va tizimlaridan boshlab, turli xil vositalar transformatsiya jarayoniga jalb qilinishi mumkin. ETL ichidagi ma'lumotlarni o'zgartirish jarayonida ko'pincha quyidagi operatsiyalar bajariladi: ma'lumotlar tuzilishini o'zgartirish; ma'lumotlarni yig'ish; qadriyatlarni tarjima qilish; yangi ma'lumotlarni yaratish; ma'lumotlarni tozalash. Ma'lumotni yuklash jarayoni bosqichli jadvallardan ma'lumotlarni ombor tuzilmasiga o'tkazish haqida. Keyingi yuklab olishda manbalardan olingan barcha ma'lumotlar ma'lumotlar omboriga berilmaydi, faqat oldingi yuklab olishdan o'tgan vaqt oralig'ida o'zgartirilgan ma'lumotlar. Bunday holda, ikkita oqim ajralib turadi:
oqim qo'shish - yangi, ilgari mavjud bo'lmagan ma'lumotlar ma'lumotlar omboriga uzatiladi; yangilash oqimi (qo'shimchalar) - ma'lumotlar ilgari mavjud bo'lgan, ammo o'zgartirilgan yoki to'ldirilgan ma'lumotlar omboriga uzatiladi. Yuklab olingan ma'lumotlarni oqimga tarqatish uchun ma'lumotlar vositalaridan foydalaniladi. Ular ma'lum vaqtlarda ma'lumotlarning holatini qayd etib, qaysi ma'lumotlar o'zgartirilgan yoki to'ldirilganligini aniqlaydilar.
Ma'ruza 12. Ishonchli axborot izlash tizimlarini baxolash. Ishonchli axborot izlash tizimlarini modellari. Axborot izlash tizimlarini uslublari va tamoyillari. Ishonchli axborot izlash usuli.

Reja : 1. Ishonchli axborot izlash tizimlarini baxolash.


2. Axborot izlash tizimlarini uslublari va tamoyillari.
Ishonchli axborot izlash tizimlarini baxolash.
Klassik ma'lumotlar bazasi nazariyasida ma'lumotlar modeli - bu ma'lumotlar bazasini boshqarish tizimida (DBMS) ma'lumotlarni taqdim etish va qayta ishlashning rasmiy nazariyasi bo'lib, u kamida uchta jihatni o'z ichiga oladi: struktura jihati: ma'lumotlar bazasida tiplar va mantiqiy ma'lumotlar tuzilmalarini tavsiflash usullari; manipulyatsiya jihati: ma'lumotlarni boshqarish usullari; yaxlitlik tomoni: ma'lumotlar bazasining yaxlitligini tavsiflash va saqlash usullari. Tuzilish aspekti ma'lumotlar bazasi mantiqiyligini, manipulyatsiya tomoni ma'lumotlar, ma'lumotlar bazasi holatlari (ya'ni ma'lumotlarni o'zgartirish usullari) va ma'lumotlar bazasidan ma'lumotlarni olish usullarini, yaxlitlik tomoni bazaning to'g'ri holatini tavsiflash vositalarini belgilaydi. Ma'lumotlar modeli - bu foydalanuvchi bilan o'zaro aloqada bo'lgan mavhum kirish mashinasini tashkil etadigan mavhum, mustaqil, mantiqiy ob'ektlar, operatorlar va boshqa elementlarning ta'rifi. Ushbu ob'ektlar ma'lumotlar strukturasini modellashtirishga imkon beradi, va operatorlar - ma'lumotlarning xatti-harakati1. Har bir ma'lumotlar bazasi va ma'lumotlar bazalari ba'zi bir ochiq yoki yashirin ma'lumotlar modeli asosida quriladi. Xuddi shu ma'lumotlar modelida yaratilgan barcha ma'lumotlar bazalari bir xil turga kiradi. Masalan, relyatsion ma'lumotlar bazasi relyatsion ma'lumotlar modeliga asoslanadi, tarmoq ma'lumotlar bazasi ma'lumotlari - tarmoq ma'lumotlari modeli, ierarxik ma'lumotlar bazasi - ierarxik ma'lumotlar modeli va boshqalar. Terminologiya haqida adabiyotlarda, maqolalarda va kundalik nutqda "ma'lumotlar modeli" atamasi ba'zan "sxema" ma'nosida ishlatiladi. ma'lumotlar bazalari "(" ma'lumotlar bazasi modeli "). Bunday foydalanish noto'g'ri, chunki ko'plab nufuzli mutaxassislar, shu jumladan K. J. Date, M. R. Kogalovskiy, S. D. Kuznetsov. Ma'lumotlar modeli bu nazariya yoki modellashtirish vositasi, ma'lumotlar bazasi modeli (ma'lumotlar bazasi sxemasi) esa simulyatsiya natijasidir. K. Datening so'zlariga ko'ra, bular va ma'lumotlarning o'zaro bog'liqligi, ular bilan Kontseptsiya dasturlash tili va ushbu tildagi muayyan dastur o'rtasidagi munosabatlarga o'xshash.
MR Kogalovskiy atamaning evolyutsiyasini quyidagicha izohlaydi. Dastlab, ma'lum bir ma'lumotlar bazasida ma'lumotlar tuzilishi sifatida ma'lumotlar modeli tushunchasi ishlatilgan. Ma'lumotlar bazasi tizimlari nazariyasini rivojlantirish jarayonida "ma'lumotlar modeli" atamasi yangi mazmunga ega bo'ldi. Simulyatsiya natijasini emas, balki vositani anglatadigan va shu tariqa ma'lum bir sinfning turli xil ma'lumotlar bazalarini o'zida mujassam etgan atama kerak edi. 70-yillarning ikkinchi yarmida ushbu muammolarga bag'ishlangan ko'plab nashrlarda shu maqsadda "ma'lumotlar modeli" atamasidan foydalanila boshlandi. Hozirgi vaqtda ilmiy adabiyotlarda "ma'lumotlar modeli" atamasi aksariyat hollarda instrumental ma'noda (modellashtirish vositasi sifatida) talqin etiladi! Biroq, uzoq vaqt davomida "ma'lumotlar modeli" atamasi rasmiy ta'rifsiz ishlatilgan. Ushbu kontseptsiyani rasmiy ravishda aniqlagan birinchi mutaxassislardan biri E. Codd edi. "Ma'lumotlar bazasini boshqarishdagi ma'lumotlar modellari" nomli maqolasida u ma'lumotlar modelini uchta komponentning kombinatsiyasi sifatida belgiladi: har qanday ma'lumotlar bazasiga mos keladigan har qanday ma'lumotlar bazasi uchun asosiy qurilish bloklarini tashkil etuvchi ma'lumotlar ob'ekti turlarining to'plami; yaxlitlikning umumiy qoidalari to'plami, har qanday bunday ma'lumotlar bazasida qonuniy ravishda paydo bo'lishi mumkin bo'lgan ob'ekt turlari turlarining cheklanishini cheklash; tanlash va boshqa maqsadlar uchun bunday ob'ekt instansiyalariga qo'llaniladigan operatsiyalar to'plami! Ma'lumotlar bazalari uchun umumiy mantiqiy ma'lumotlar modellariga misollar: Ierarxik ma'lumotlar modeli tarmoq modeli relyatsion model ER modeli kengaytirilgan shaxs bilan o'zaro aloqa modeli sinonimi Ob'ekt modeli Hujjatga yo'naltirilgan model Attribute Object Model Star Schema Ob'ektga taalluqli ma'lumotlar bazasi ikkita bog'liq tuzilmani birlashtiradi. Fizik ma'lumotlar modellariga quyidagilar kiradi: Inverted indeks Yassi fayl Boshqa modellar: Assotsiativ model korrelyatsiya modeli Ko'p o'lchovli model Ko'p yo'nalishli model Semantik model XML ma'lumotlar bazasi Triplestore nomli grafik aloqalari va funktsiyalari Ma'lumotlar bazasini boshqarish tizimi bir yoki bir nechta modelni taqdim qilishi mumkin. Optimal tuzilma ilova ma'lumotlarining tabiiy tashkil etilishiga va talablarga bog'liq. Ma'lumotlar bazasini boshqarish tizimlarining aksariyati bitta aniq ma'lumot modeli atrofida qurilgan, ammo mahsulotlar bir nechta modellarni qo'llab-quvvatlashi mumkin. Turli xil fizika modellari har qanday berilgan mantiqiy modelni amalga oshirishi mumkin. Ko'pgina ma'lumotlar bazasini boshqarish tizimlari foydalanuvchiga jismoniy bajarishni sozlashda boshqaruvning ba'zi bir darajalarini taklif qiladi, chunki ularning tanlovi ishlashga sezilarli ta'sir qiladi. Model nafaqat ma'lumotlarni tuzishning bir usuli emas, balki ma'lumotlar ustida bajarilishi mumkin bo'lgan operatsiyalar to'plamini ham belgilaydi. Masalan, relyatsion model Select (loyiha) va јoin kabi operatsiyalarni belgilaydi. Ushbu operatsiyalar ma'lum bir so'rovlar tilida aniq bo'lmasligi mumkin bo'lsa ham, ular so'rovlar tilining asosini yaratadi. Yassi model Yassi (yoki jadvalli) model bitta elementlarning bitta ikki o'lchovli qatoridan iborat bo'lib, unda berilgan ustunning barcha a'zolari bir xil qiymat deb hisoblanadi va barcha satr a'zolari bir-biri bilan bog'liq deb taxmin qilinadi. Masalan, tizimning xavfsizlik ma'lumotlar bazasining bir qismi sifatida foydalanish mumkin bo'lgan nom va parol uchun ustunlar. Har bir satrda individual foydalanuvchi bilan bog'liq bo'lgan maxsus parol bo'ladi. Jadval ustunlari ko'pincha ular bilan bog'liq bo'lgan turga ega bo'lib, ularni belgilar, sana yoki vaqt ma'lumotlari, butun son yoki suzuvchi nuqta raqami sifatida belgilaydi. Ushbu jadval formati relyatsion modelning oldingi qismidir. Dastlabki ma'lumotlar modellari Ushbu modellar 1960-70-yillarda mashhur bo'lgan, ammo bugungi kunda ulardan keng foydalanishni eski tizimlarda topish mumkin. Ular, birinchi navbatda, mantiqiy jismoniy tasvirlar o'rtasida kuchli bog'liqlik bilan navigatsiya va ma'lumotlar mustaqilligining yo'qligi bilan tavsiflanadi. Ierarxik model Ierarxik modelda ma'lumotlar har bir yozuv uchun bitta ota-onadan iborat bo'lgan daraxt tuzilishida tashkil etilgan. Saralash maydoni birodarlik yozuvlarini ma'lum tartibda saqlaydi. Ierarxik tuzilmalar IBM IMS kabi ma'lumotlar bazasini boshqarishning asosiy tizimlari tomonidan keng qo'llanilgan va hozirda XML hujjatlarining tuzilishini tavsiflaydi. Ushbu struktura ikkita ma'lumot turi o'rtasidagi o'zaro aloqani ta'minlaydi. Ushbu struktura haqiqiy hayotdagi ko'plab munosabatlarni tasvirlash uchun juda samarali; Dastlabki tizimlarda retseptlar tarkib jadvali, paragraf / oyat tartibi, har qanday ichki va tartiblangan ma'lumotlar.
Ushbu ierarxiya omborxonadagi yozuvlarning jismoniy tartibi sifatida ishlatiladi. Yozish uchun kirish ketma-ket kirish bilan birgalikda ko'rsatgichlardan foydalangan holda ma'lumotlar strukturasini pastga tushirish orqali amalga oshiriladi. Shu sababli, ierarxik tuzilma ba'zi ma'lumotlar bazalari uchun samarasiz bo'lib, unda to'liq yo'l (har xil yozuvlar va saralash maydonlaridan farqli o'laroq) har bir yozuvga kiritilmagan. Bunday cheklashlar jismoniy jismoniy ierarxiyaga qo'yilgan qo'shimcha mantiqiy ierarxiyalarda qoplandi. IMSning keyingi versiyalaridagi tarmoq modeli Tarmoq modeli ko'p-ko'p munosabatlarga ruxsat berish orqali ierarxik tuzilmani kengaytiradi. Model relyatsion model uchun eng mashhur almashtirish edi va CODASYL spetsifikatsiyasi bilan aniqlandi. Tarmoq modeli ma'lumotlar va yozuvlar deb nomlangan ikkita asosiy tushunchadan foydalanib ma'lumotlarni tashkil qiladi. Yozuvlarda maydonlar mavjud (ularni COBOL dasturlash tilida bo'lgani kabi, ierarxik ravishda tashkil qilish mumkin). Setlar (matematik to'plamlar bilan chalkashmaslik kerak) yozuvlar o'rtasidagi birdan-ko'pga bog'liqlikni belgilaydi: bitta egasi, ko'plab a'zolari. Yozuv har qanday to'plamning egasi va istalgan miqdordagi to'plamning a'zosi bo'lishi mumkin. To'plam aylanma bog'langan ro'yxatlardan iborat bo'lib, unda bitta yozuv turi, to'plam egasi yoki ota-onasi har bir davrada bir marta paydo bo'ladi va ikkinchi yozuv turi, bo'ysunuvchi yoki bola har bir davrada bir necha marta paydo bo'lishi mumkin. Shunday qilib, har qanday ikki turdagi yozuvlar o'rtasida ierarxiya o'rnatilishi mumkin, masalan, A turi - B egasi. Shu bilan birga, boshqa to'plamni belgilash mumkin, bu erda B - A egasi. Shunday qilib, barcha to'plamlar umumiy yo'nalishni o'z ichiga oladi) yoki tarmoq tuzilishi. Yozuvlarga kirish ketma-ket (odatda har bir yozuv turida) yoki yo'naltirilgan grafikada navigatsiya qilinadi (Egalik huquqi Tarmoq modeli doiraviy bog'langan ro'yxatlarni taqdim etishga qodirligini aniqlaydi. Ma'lumotlarning ko'payishi ierarxik modelga qaraganda samaraliroq va tugundan bir nechta yo'l bo'lishi mumkin - tarmoq modelining ota-onadan bolaga yo'naltirilgan operatsiyalari navigatsion uslubda amalga oshiriladi: dastur joriy pozitsiyani saqlab turadi va yozuv ishtirok etgan munosabatlarga rioya qilgan holda bir yozuvdan ikkinchisiga o'tadi. Yozuvlarni shuningdek asosiy qiymatlarni belgilash orqali topish mumkin.Bu modelning muhim xususiyati emas. ma'lumotlar bazalari odatda o'rnatilgan manzillarni to'g'ridan-to'g'ri manzilga yo'naltiruvchi ko'rsatmalar yordamida amalga oshiradilar. Bu ma'lumotlar bazasini yuklash va qayta tuzish kabi disk operatsiyalariga yozish orqali juda yaxshi qidiruv samaradorligini ta'minlaydi. Kullinet. IDMS qabul qilindi muhim mijozlar bazasi; 1980-yillarda u o'ziga xos vositalar va tillarga qo'shimcha ravishda relyatsion model va SQL ni qabul qildi.
Ob'ektlar ma'lumotlar bazasi (1990-yillarda ixtiro qilingan) ob'ektlarning tarmoqlarida tezkor navigatsiya qilish uchun navigatsiya kontseptsiyasidan foydalanadi, odatda ob'ekt identifikatorlarini tegishli ob'ektlarga "aqlli" ko'rsatkich sifatida ishlatadi. Ob'ektivlik / MB. masalan, u ma'lumotlar bazalarini kesib o'tishi mumkin bo'lgan "yakka", "ko'p", "ko'pga" va "ko'pdan ko'pga" munosabatlarni amalga oshiradi. Ko'pgina ob'ektlarning ma'lumotlar bazalari ikkala modelning kuchli tomonlarini birlashtirgan holda SOQL-ni qo'llab-quvvatlaydi. Inverted File Model Inverted File yoki inverted indeksida ma'lumotlar tarkibi qidirish jadvalidagi kalitlar sifatida ishlatiladi va jadvaldagi qiymatlar ushbu tarkibiy qismning har bir nusxasi joylashgan joyni ko'rsatuvchi ko'rsatkichlardir. Bundan tashqari, zamonaviy ma'lumotlar bazasi indekslarining mantiqiy tuzilishi bo'lib, u faqat Modeldagi tarkibni inverterli fayllar bilan belgilangan jadval ustunlaridan foydalanish uchun ishlatishi mumkin, bu fayllardagi kerakli yozuvlarga samarali kirish uchun indekslarni mavjud tekis ma'lumotlar bazasi fayllari yonidagi ikkinchi to'plamga joylashtirishi mumkin. Ushbu ma'lumot modelidan foydalanish uchun 1970 yilda taqdim etilgan ADABAS DBMS of Software AG diqqatga sazovor. ADABAS muhim mijozlar bazasini sotib oldi va bugungi kunda mavjud. 1980-yillarda u relyatsion modelni va POISK-da SQL-ni qabul qildi. ma'lumotlar va dastlabki vositalar va tillarni to'ldirishdan oldin saqlanadi. XML yoki JSON ma'lumotlar ob'ektlarini tezkor, to'liq matnli qidirishni ta'minlaydigan va katta ma'lumotlarning kengayishini ta'minlaydigan hujjatlar bazasiga asoslangan inverter indeksatsiya modeli. Clusterpoint o'rnatilgan taqsimlangan ma'lumotlar bazasida birlashtirilgan SQL so'rovini, bepul matnli qidiruvni va JavaScript kodini qidirishga imkon beradigan ichki hisoblash tizimiga ega. Ma'lumotlar sifatida, invertirlangan indekslarni bir xil Clusterpoint ma'lumotlar bazasida milliardlab ma'lumotlar ob'ektlarini qo'llab-quvvatlash uchun ko'p sonli serverlarga tarqatish va tarqatish mumkin. Clusterpoint JS / SQL so'rovlar tili SQL va JavaScript sintaksisini to'liq matnli qidiruv bilan birlashtiradi, bu erda amalga oshiriladigan inverted Clusterpoint ma'lumotlar ko'rsatkichi matn qidiruv natijalarini millisekundlarda va veb-va mobil dasturlarda tegishli paginatsiyalarni etkazib berish uchun ishlatiladi. Clusterpoint Database Inverted Database Index, shuningdek, dasturlashtirilishi mumkin bo'lgan ahamiyatlilik reytingini qo'llab-quvvatlaydi, bu sizning qidiruv natijalaringizni qo'shimcha kodlashsiz o'zgartirishga imkon beradi. Taqsimlangan ma'lumotlar bazasi tranzaktsiyalari singari, ma'lumotlar bazasi uchun aloqador Clusterpoint ACID-ni qo'llab-quvvatlaydi, ma'lumotlarning izchil hujjat bazasi, bu erda invertirlangan indeks ma'lumotlari tezda XML yoki JSON hujjat tarkibidagi yangilanishlar bilan birga yangilanadi.
Indeks shuningdek real vaqt rejimida hisobot berish, tahlil qilish, Clusterpoint ma'lumotlar bazasida REST API-larida ma'lumotlarni yig'ish va qo'llab-quvvatlash uchun ishlatiladi. Relyatsion model Relyatsion model 1970 yilda E.F. KODDOM tomonidan ma'lumotlar bazasini boshqarish tizimlarini biron bir amaliy dasturdan ko'proq mustaqil qilish usuli sifatida joriy etilgan. Bu matematik model bo'lib, u predikatik mantiq va to'plam nazariyasi nuqtai nazaridan aniqlanadi va foydalanadigan tizimlar asosiy tarmoq, kompyuter va mikrokompyuter tizimlarida qo'llaniladi. Odatda relyatsion ma'lumotlar bazasi deb nomlanadigan mahsulotlar aslida Codd tomonidan belgilangan matematik modelga yaqinlashadigan modelni amalga oshiradi. Baza ma'lumotlar modellarida uchta asosiy atama keng qo'llaniladi: munosabatlar, atributlar va domenlar. Aloqa bu ustunlar va satrlar bo'lgan jadval. Aloqaning nomlangan ustunlari atributlar deb nomlanadi va domen atributlar olishi mumkin bo'lgan qiymatlar to'plamidir. Relyatsion modelning asosiy ma'lumotlar tarkibi jadvallar bo'lib, unda ma'lumotlar satrlar (shuningdek, qoziqlar deb ham ataladi) va ustunlar ko'rinishida taqdim etiladi. Shunday qilib, "nisbiy ma'lumotlar bazasida" "kechiktirish" bu ma'lumotlar bazasidagi turli jadvallarni anglatadi; Aloqa bu to'rlar to'plamidir. Ustunlar ob'ektning turli xil atributlarini (masalan, xodimning ismi, manzili yoki telefon raqami) ro'yxatlashtiradi va satr munosabat bilan ko'rsatilgan ob'ektning (ma'lum bir xodimning) haqiqiy namunasi. Natijada, etploee jadvalidagi har bir tup bir xil ishchining boshqa atributini aks ettiradi. Muayyan ob'ekt (masalan, xodim) uchun nisbiy ma'lumotlar bazasidagi barcha munosabatlar (va shuning uchun jadvallar) jadvalda ahamiyatsiz deb tasniflanishi mumkin bo'lgan ba'zi asosiy qoidalarga rioya qilishlari kerak. Ikkinchidan, jadvalda bir xil tutqichlar yoki satrlar bo'lishi mumkin emas. Uchinchidan, har bir qo'shimcha qism har bir atribut uchun bitta qiymatga ega bo'ladi. Relyatsion ma'lumotlar bazasida "tekis" ma'lumotlar bazasi modeliga o'xshash bir nechta jadval mavjud. Relyatsion modelning kuchli tomonlaridan biri shundaki, printsipial ravishda ikki xil yozuvda yuzaga keladigan har qanday qiymat (bir xil jadvalga yoki turli jadvallarga tegishli) bu yozuvlar o'rtasidagi munosabatni anglatadi. Biroq, aniq yaxlitlikni cheklash uchun jadvallardagi yozuvlar o'rtasidagi aloqalarni, shuningdek, kardinalik tayinlash (1: 1, (0) 1: M, M: M) bilan tavsiflangan ota-ona-bola munosabatlarini aniqlab olish mumkin. Jadvallarda bitta atribut tayinlangan yoki jadvalda har bir tupni noyob identifikatsiyalash uchun ishlatiladigan "kalit" vazifasini bajaradigan atributlar to'plami bo'lishi mumkin. munosabatlar.
Jadvaldagi satrlarni aniq aniqlash uchun ishlatilishi mumkin bo'lgan kalit ikki yoki undan ortiq jadvallarning ma'lumotlarini birlashtirish yoki birlashtirish uchun ishlatiladi deyiladi. Masalan, "Xodimlar" jadvalida "Joylashuv" deb nomlangan ustun mavjud bo'lib, unda "Joylashtirish" jadvalining kalitiga mos keladigan qiymat mavjud. Kalitlar indekslarni yaratishda ham muhimdir, bu esa katta jadvallardan ma'lumotlarni tezda topishni osonlashtiradi. Biron bir ustun kalit bo'lishi mumkin yoki bir nechta ustunlar birlashtirilgan kalitlarga guruhlanishi mumkin. Barcha kalitlarni oldindan belgilash shart emas; Ustun, agar u dastlab mo'ljallanmagan bo'lsa ham, kalit sifatida ishlatilishi mumkin. Tashqi, haqiqiy ma'noga ega bo'lgan kalit (masalan, odamning ismi, ISBN kitobi yoki avtomobilning seriya raqami) ba'zan "tabiiy" kalit deb ataladi. Agar biron bir tabiiy kalit asosiy kalit bo'lmasa. Kalitlar odatda yaxshi (Braun deb nomlangan ko'pchilikni o'ylang), xodimlarning shaxsiy raqamlari berilishi mumkin). Amalda, aksariyat ma'lumotlar bazalari yoki surishtiruvchi KEYs (masalan, ma'lumotni aniqlashda ham, ham tabiiy kalitlar mavjud, chunki hosil bo'lgan kalitlar ichki qismdan sindirib bo'lmaydigan satrlar orasidagi munosabatlarni yaratish uchun ishlatilishi mumkin, tabiiy kalitlardan esa kamroq ishonch bilan foydalanish mumkin) , ma'lumotlar bazasini izlash va integratsiya qilish uchun (Masalan, boshqa rivojlangan ma'lumotlar bazalaridagi yozuvlarni ijtimoiy ikkita mustaqil sug'urta soniga taqqoslash mumkin, chunki sug'urta noto'g'ri, yo'qolgan yoki o'zgartirilgan.) Relyatsion modelda ishlatiladigan eng keng tarqalgan so'rovlar tili bu tuzilgan til. Query (SQL) o'lchovli model Ushbu model ma'lumotlar omborlarida ma'lumotlarni namoyish qilish uchun ishlatiladigan relyatsion modelning ixtisoslashtirilgan moslashuvi bo'lib, ma'lumotlarni interfaol analitik ishlov berish yoki OLAP so'rovlari yordamida osongina umumlashtirish mumkin. O'lchovli modelda ma'lumotlar bazasi sxemasi bitta katta qismdan iborat. o'lchovlar va o'lchovlardan foydalanib tavsiflangan faktlar jadvali. O'lchov faktning kontekstini taqdim etadi (masalan, kim ishtirok etgan, qachon va qaerda bo'lgan va uning turi) va tegishli faktlarni guruhlash uchun so'rovlarda ishlatiladi. Hajmlar diskret va ko'pincha ierarxikdir; Masalan, joylashuv bino, shtat va mamlakatni o'z ichiga olishi mumkin. O'lchov - bu daromad kabi haqiqatni tavsiflovchi miqdor. Ushbu chora-tadbirlar asosan turli joylardan keladigan daromadlarni birlashtirishi mumkin. OLAP so'rovida o'lchovlar tanlanadi va xulosalar yaratish uchun faktlar guruhlanadi va birlashtiriladi. Ko'pincha o'lchovli model relyatsion modelning tepasida faktlar va bitta ijtimoiy raqamlar mavjud bo'lganda istisnolarni o'z ichiga olgan markazlashtirilmagan markazlashtirilmagan jadvallardan tashkil topgan yulduz sxemasi yordamida amalga oshiriladi.
Qor parchalanish sxemasi deb nomlangan alternativ jismoniy amalga oshirish, bir nechta jadvallarga o'lchov ichidagi ko'p darajali ierarxiyalarni normallashtiradi. O'lcham jadvallari ma'lumot omborlarida almashinadi, bu esa ularni birgalikda ishlatishga imkon beradi. O'lchovlarning standart to'plamini yaratish, o'lchovlarni simulyatsiya qiladigan ko'p o'lchovli diagrammalarni o'z ichiga olishi mumkin bo'lgan muhim qismdir. OLAP uchun juda mashhur ma'lumotlar bazasi tuzilmasi. Post-relatsion ma'lumotlar bazasi modellari Relyatsion modelga qaraganda ko'proq umumiy ma'lumot modelini taklif qiladigan mahsulotlar ba'zida post-relatsion deb tasniflanadi. Shu bilan bir qatorda gibrid ma'lumotlar bazasi, RDBMS kengaytirilgan ob'ekti va boshqalarni o'z ichiga oladi. Bunday mahsulotlarda ma'lumotlar modeli o'zaro munosabatlarni o'z ichiga oladi, ammo Codd-ning Axborot printsipi bilan chegaralanmaydi, bu ma'lumotlar bazasidagi barcha ma'lumotlarni munosabatlardagi qadriyatlar nuqtai nazaridan aniq ko'rsatilishini talab qiladi. relatsion modelga ushbu kengaytmalarning qaysi biri relatsion modeldan oldingi texnologiyalar tushunchalarini birlashtiradi. Masalan, ular sizga tugunlardagi daraxtlar bilan yo'naltirilgan grafikni ko'rsatishga imkon beradi. Nemis kompaniyasi sones ushbu kontseptsiyani o'zining Grafik B.-da amalga oshirmoqda. Bir nechta post-relatsion mahsulotlar relatsion bo'lmagan funktsional tizimlarga ega. Grafika Model Graf ma'lumotlar bazalari tarmoq ma'lumotlar bazasiga qaraganda ko'proq umumiy tuzilishga imkon beradi; Har qanday tugunni har qanday boshqa tugunga ulash mumkin. Ko'p o'lchovli modellar Ko'p qiymatli ma'lumotlar bazalari "chalkash" ma'lumotlardir, chunki ular nisbiy ma'lumotlar bazalari singari saqlashi mumkin, ammo ishlashi ham o'lchovli modelni o'zi yaratdi. Relyatsion model faqat quyi jadvallardan foydalanib taxmin qilishi mumkin bo'lgan chuqurlik darajasiga ruxsat bering. Bu XML ma'lumotlarini qanday ifodalashi bilan deyarli bir xil, chunki berilgan maydon / atribut bir vaqtning o'zida bir nechta to'g'ri javoblarga ega bo'lishi mumkin. Polizemiyani XML kontsentrlangan shakli deb hisoblash mumkin. Afzallik (kontseptual) va tuzilish (ma'lumotlar taqdimoti) birma-bir. Bundan tashqari, bu o'qishlar sonining kamayishiga, havolalarning yaxlitligi bilan bog'liq muammolarning kamayishiga va ushbu operatsiyani bajarish hajmini qo'llab-quvvatlash uchun zarur bo'lgan uskunaning sezilarli darajada pasayishiga olib keladi. Ob'ektga yo'naltirilgan model 1990-yillarda ob'ektga yo'naltirilgan dasturlash paradigmasi ma'lumotlar bazasi texnologiyasida qo'llanilib, ob'ektlar bazasi deb nomlanuvchi yangi ma'lumotlar bazasi modelini yaratdi. Bu ob'ektga nisbatan empedansning mos kelmasligini oldini olishga qaratilgan - ma'lumotlar bazasida uning vakilligi o'rtasida ma'lumotni almashtirishning ortiqcha qiymati shundan iboratki, teksturaning atomliligi (masalan, jadvaldagi satrlar kabi) va uni amaliy dasturda taqdim etish (odatda ob'ektlar sifatida). Bundan tashqari, tip tizimidan to'g'ridan-to'g'ri ma'lumotlar bazasida foydalanish mumkin, bu ma'lumotlar bazasiga bir xil ma'lumotlar yaxlitligini kiritish imkonini beradi. Ob'ektlar ma'lumotlar bazasi ob'ektlar dasturining asosiy g'oyalarini, masalan, encapsulation va polimorphism ma'lumotlar bazasiga kiritadi.



Download 225.96 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling