22. Qidiruv algoritmlarida indekslash nima?


Ma’lumotlarni saralash diskda qo’llaydigan algoritm nima deyiladi?


Download 0.92 Mb.
bet14/28
Sana22.01.2023
Hajmi0.92 Mb.
#1109479
1   ...   10   11   12   13   14   15   16   17   ...   28
Bog'liq
22. Qidiruv algoritmlarida indekslash nima?

41. Ma’lumotlarni saralash diskda qo’llaydigan algoritm nima deyiladi?
Agar fayllarning oraliq indekslash hajmi mavjud tezkor xotira hajmiga teng bo'lsa, muammoni siqish texnikasi yordamida hal qilish mumkin. Ammo ko'plab yirik to'plamli fayllar siqilgandan keyin ham xotiraga sig'maydi.
Agar tezkor xotira hajmi etarli bo'lmasa, tashqi tartiblash algoritmi (external sorting algorithm) kerak, ya'ni diskda qo’llaydigan algoritm. Kutilgan tezlikka erishish uchun saralash vaqtida bunday algoritm disk bo'ylab disk kallakchasining tasodifiy harakatlanish sonini minimallashtirishi kerak - natijada ma'lumotlarni o'qish tezlashadi (4.1-bo'limga qarang). Ushbu muammoning echimlaridan biri bu saralashga asoslangan blok indekslash algoritmi (blocked sort-based indexing), yoki BSBI, 4.2-rasmda ko’rsatilganidek. BSBI algoritmi 1) to'plamni teng qismlarga ajratadi; 2) har bir qismning "termID-docID" juftlarini xotirada saralaydi, 3) oraliq tartiblangan natijalarni diskka saqlaydi va 4) barcha oraliq natijalarni yakuniy indeksga birlashtiradi.


42.Indekslash nima?
«Излаш модули» - деганда фойдаланувчининг сўровига жавоб сифатида
энг долзарб, электрон ресурсларнинг тартибга солинган тўпламини тақдим
этадиган, фойдаланувчининг қулай интерфейси билан жиҳозланган,
маълумотлар базаси ва статистик маълумотларга эга бўлган тизим ости
тушунилади.
Корпоратив тармоқда излаш модулининг элементлари иккита асосий,
бир-биридан мустақил элементлардан таркиб топади, булар индекслаш
элементи ва излаш элементидир. Фойдаланувчи фақат излаш элементининг
имкониятини кўриб, ундан фойдаланади. Индекслаш элементи МИТнинг
ичида керакли маълумотни излаш амалга ошириладиган маълумотларни мос
равишда самарали намоён этиш шаклини яратиш учун қўлланилади.
Indekslash nimani anglatadi
Bu robotlar mavjud ma'lumotlarni bitta ma'lumotlar bazasiga qo'shish jarayoni. Keyin ular qayta ishlanadi. Ma'lumot yig'ish, indeksni shakllantirish avtomatik yoki qo'lda sodir bo'lishi mumkin. Birinchi holda, robot saytlarni qidiradi, buning uchun u sitemap.xml faylini skanerlaydi yoki boshqa saytlarning tashqi havolalarini kuzatadi. Ikkinchi versiyada sayt egasining o'zi saytning URL manzilini Google, Yandex va boshqalarning ixtisoslashtirilgan ariza shakllariga qo'shib qo'yadi.
Indekslash birinchi marta 25 yil oldin paydo bo'lgan. Keyin indekslangan sahifalar bazasi kalit so'zlar bilan mavzu indeksining printsipi asosida qurildi (robotlar kalit so'zlarni izlash bilan shug'ullangan). Bugungi kunda mexanizm ancha murakkablashdi va samaraliroq bo'ldi. Hozirgi bosqichda ma'lumotlarning indeksga kiritilishi uchun ular dastlab ixtisoslashgan hisoblash algoritmlari bilan qayta ishlanadi va sun'iy intellektdan foydalaniladi.

Download 0.92 Mb.

Do'stlaringiz bilan baham:
1   ...   10   11   12   13   14   15   16   17   ...   28




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling