22. Qidiruv algoritmlarida indekslash nima?


Izlash tizimida mantiqiy modelning o’rnini tusuntiring


Download 0.92 Mb.
bet27/28
Sana22.01.2023
Hajmi0.92 Mb.
#1109479
1   ...   20   21   22   23   24   25   26   27   28
Bog'liq
22. Qidiruv algoritmlarida indekslash nima?

65. Izlash tizimida mantiqiy modelning o’rnini tusuntiring
Axborotni qidirishda qidiruv modeli tushunchasi ishlatiladi. Qidiruv modeli - bu IRS qaror qabul qilishiga imkon beradigan baholash formulasi yaratilgan modeldir: qaysi hujjat topilgan deb hisoblanishi kerak va uni qanday tartiblash kerak. Axborot olish modellari odatda uch turga bo'linadi: set-nazariy (mantiqiy, noaniq to'plamlar, kengaytirilgan mantiqiy); algebraik (vektor, umumlashtirilgan vektor, latent-semantik, asab tarmog'i) va ehtimollik.
Mantiqiy model (boolean, mantiqiy, ikkilik) - to'plamlarning kesishishi, birlashishi va ayirilishi operatsiyalariga asoslangan qidiruv modeli. Ushbu modelda qidiruv so'zining mavjudligi "Ha" degan ma'noni anglatadi (hujjat topilgan deb hisoblanadi), qidiruv so'zining yo'qligi "Yo'q" degan ma'noni anglatadi - hujjat topilmadi. Mantiqiy moddaning kamchiligi shundaki, u reytingga ega emas.
Vektorli model - bu hujjatlarni va so'rovlarni so'zlar oralig'ida vektor sifatida, dolzarbligini esa ular orasidagi masofa sifatida ko'rib chiqadigan axborot qidirish modeli. Ushbu modeldagi reyting statistik kuzatuvga asoslangan. Kuzatish natijalariga ko'ra, hujjatdagi (TF) atamaning chastotasi qanchalik ko'p bo'lsa va to'plamdagi (IDF) atamaning teskari paydo bo'lishi qanchalik katta bo'lsa, ushbu hujjatning og'irligi muddat. TF*IDF vektor modeli sinonimi sifatida keng qo'llaniladi. TF*IDF - so'z va hujjatning vektor modelidagi mos kelishining raqamli o'lchovi; bu qanchalik ko'p bo'lsa, bu hujjatda nisbatan tez-tez va to'plamda nisbatan kamroq uchraydi
Ehtimoliy model - bu ma'lumotni qidirish modeli, bu dolzarblikni berilgan hujjatdagi so'zlarni ideal javobga moslashtirish ehtimoli asosida berilgan hujjatning so'rovga javob berish ehtimoli deb biladi. Ushbu modeldagi dolzarblik ushbu hujjatning foydalanuvchi uchun foydali bo'lishi ehtimoli sifatida qaraladi. Bu dastlab allaqachon mavjudligini anglatadi
Har bir keyingi hujjat uchun ahamiyatlilik ehtimoli to'plamning "ahamiyatsiz" qismida qolgan to'plamda atamalarning paydo bo'lish nisbati asosida hisoblanadi. Ehtimoliy modellar biroz afzalliklarga ega, chunki ular qidiruv natijalarini saralashadi - hujjatlarni "tegishli bo'lish ehtimoli" ning kamayish tartibida tartibga solish.

Download 0.92 Mb.

Do'stlaringiz bilan baham:
1   ...   20   21   22   23   24   25   26   27   28




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling