22. Qidiruv algoritmlarida indekslash nima?
Indeksni qurish deb nimaga aytiladi? (
Download 0.92 Mb.
|
22. Qidiruv algoritmlarida indekslash nima?
- Bu sahifa navigatsiya:
- 34. Indeksator nima
33.Indeksni qurish deb nimaga aytiladi? (33,34,36 deyarli bir xil savollar)
Sanoq indeksni qanday yaratish jarayoni indeksni qurish (index construction) yoki indekslash deb ataladi (indexing). Bunday ishni bajarish jarayoni yoki bu ishni bajaradigan mashina indeksator deb ataladi (indexer). Indekslash algoritmlarini ishlab chiqish jarayoni apparat imkoniyatlari bilan bog’liq holda cheklangan. Shu sababli, biz ushbu bobni indeksatsiya bilan bog'liq kompyuter texnik ta’minti asoslarini umumiy ko'rib chiqish bilan boshlaymiz. Shundan so'ng biz statik kollektsiyalar bilan ishlashning samarali bitta mashina algoritmini blokirovkalashga asoslangan indekslashni (blocked sort-based indexing) tasvirlaymiz. Buni oddiy saralashga asoslangan indeksatsiya algoritmining kengaytiriladigan versiyasi deb hisoblash mumkin. Bir martalik xotirada indekslash (single-pass in-memory indexing), Ushbu algoritm yanada keng qamrovlidir, chunki u so’zlarni xotirada saqlashni ta'minlamaydi. Juda katta ma’lumotlar to'plamlarni qidirish uchun, masalan, veb tarmoqdagi-indeksasiya yuzlab yoki minglab kompyuterlarning klasterlari bo'yicha taqsimlanishi kerak. Tez-tez o'zgarib turadigan to'plamlar bilan ishlash, dinamik indekslashni talab qiladi. Bu to'plamda sodir bo’lgan o'zgarishlarni indeksda darhol aks ettirishni ta'minlaydi. 34. Indeksator nima? Tartibli indeksni yaratish o’ta mushkul va mashaqqatli ish hisoblanadi. Bu jarayonni odatda terminlar ro’yхatini yaratish yoki indeksni tuzish (index construction) yoki indekslash (indexing) deb yuritiladi [3]. Bu jarayonni amalga oshiruvchi modul yoki dasturlar indeksator (indexer) deb yuritiladi [3]. Indeksator algoritmlarini yaratish va foydalnish apparat ta’minot vositalarining imkoniyatlari bilan ham bog’liqdir. orporativ tormoqlarda samarali indeksator insterumental vositasi va amaliy dasturlar ( MS Outlook, MS Excel, ma’lumotlar bazasi, SQL Server, Oracle, Kontentni boshqarish tizimlari, Oren Text, ... ) bilan tez va oson bog’lanish kerak. Indeksator (robot indeksatori) - bu o'rgimchaklar yuklab olgan sahifalarni tahlil qiladigan dastur. Indeksator sahifani to'liq tahlil qiladi tarkibiy elementlar va ularni algoritmlarning morfologik va leksik turlaridan foydalanib tahlil qiladi. Tahlil sahifaning turli qismlarida, masalan sarlavhalar, matn, havolalar, uslub va tuzilish xususiyatlari, html teglari va hk. Shunday qilib, indekslash moduli ma'lum miqdordagi manbalar havolalariga amal qilish, sahifalarni yuklab olish, olingan hujjatlarning yangi sahifalariga ulanish massasini ajratish va ularni batafsil tahlil qilish imkonini beradi. Download 0.92 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling