Ilmiy axborot izlash texnalogiyasi


Hujjatni qidirish tasviri


Download 34.13 Kb.
bet4/5
Sana22.06.2023
Hajmi34.13 Kb.
#1645898
1   2   3   4   5
Bog'liq
03. ILMIY AXBOROT IZLASH TEXNALOGIYASI

Hujjatni qidirish tasviri  - ma'lumot olish tilidagi matn, hujjatga aniq bir-biriga mos keladigan va so'rov bo'yicha qidirish uchun zarur bo'lgan xususiyatlarni aks ettiruvchi matn. Hujjatning mazmunini ochadigan yoki hech bo'lmaganda uning mavzusini aniqlaydigan qidiruv xususiyatlaridan tashqari, hujjatning qidirish tasvirida odatda identifikatsiya qiluvchi va ba'zi narsalar mavjud. qo'shimcha ma'lumotlar (chiqish, hujjat turi, uning tili va boshqalar). Qidiruv retseptlari so'rovlar qabul qilinganda hosil bo'ladi va tizimni yangi hujjatlar bilan to'ldirganda ham, so'rovga javob izlashda hujjatlarni qidirish rasmlarini yaratish mumkin. Axborot oqimi katta va tez-tez yangilanadigan tizimlarda indekslashga mablag 'sarflashning hojati yo'q va hujjatning o'zi yoki uning nomi ko'pincha hujjatning qidirish tasviri sifatida olinadi.
3. Muhimligi
IPS maqsadi - hujjatlarni berish, tegishli  (semantik jihatdan tegishli) so'rov (tegishli ingliz tilida - tegishli). Muhimligini ajratib ko'rsatish mazmunli  va rasmiy . Tarkibning dolzarbligi hujjatning norasmiy ravishda aniqlangan ma'lumot so'roviga muvofiqligi sifatida izohlanadi (Vasilisa Dono o'zi barcha yaxshi odamlarning xatlarini o'qiydi va uning talablariga javob beradigan da'vogarlarni tanlaydi) va rasmiy ahamiyatlilik - algoritmik ravishda qidirish tartibi va hujjatning qidirish rasmini taqqoslash orqali. axborot-qidiruv tizimiga asoslangan etkazib berish mezonlari .
Etkazib berish mezonlari  - rasmiy qoida, hujjatning qidiruv tasviri va qidirish tartibining rasmiy ahamiyati darajasi aniqlanadigan va ma'lumot so'roviga javoban ma'lum hujjatni berish / bermaslik to'g'risida qaror qabul qilinadigan xususiyatlar to'plami.

Axborotli ehtiyoj
Ichida avtomatlashtirilgan tizimlar  qidiruv rasmiy ahamiyatlilikka asoslanadi, ulardagi ahamiyatlilik, masalan, ekspert baholari orqali aniqlanadi va ma'lumotlarni olish uchun foydalaniladi. tizimda ma'lumot olishning samaradorligi   (uning ishining sifati). Berish mezoni sifatida hujjat va so'rovni qidirish rasmlarining to'liq mos kelishi, hujjatning bir nechta kalit so'zlariga bir nechta so'rov kalit so'zlarining kiritilishi, ushbu to'plamlarning kesishishi va boshqalar tanlanishi mumkin.
Ko'rib chiqilayotgan misolda, hujjatning kalit so'zlari va so'rovlarining to'liq mosligini berish mezoni sifatida tanlashda mijozga uning talablariga to'liq javob beradigan belgilar harflari berilishi kerak. Bu ularni qoniqtirishi dargumon, chunki tanlov juda katta bo'lmaydi. Ushbu mezon aniqlik zarur bo'lgan tizim uchun mos keladi, masalan, ma'lum bir kasallikni davolashda dori tanlashni belgilaydigan (oz bo'lsin, ammo barchasi mos), ammo kesishish mezoni bu erda mos bo'lishi mumkin.
Deskriptorlarni so'rovga muvofiqlik darajasiga qarab o'lchash mumkin; qidirishda so'rovda ham, hujjatda ham topilgan deskriptorlarning koeffitsientlari yig'iladi va ushbu miqdorning qiymatiga qarab hujjatlar beriladi (masalan, agar u ma'lum qiymatdan oshgan bo'lsa). Shunday qilib, agar siz eng muhim xususiyatlar ekanligini ko'rsatsangiz boylik va quvvatlekin yo'q mehribonlik va yoshiga qarab belgilanadi, Koshchei Immortal da'vogarlarida olinishi mumkin. Tarozi ishlatilganda u ham ishlatilishi mumkin. qatlamli etkazib berishtanlangan hujjatlar foydalanuvchiga o'zboshimchalik bilan taqdim etilmaydi, ammo ahamiyatlilik darajasiga ko'ra (og'irliklarning pasayishi tartibida) foydalanuvchi tegishli hujjatlarni yakuniy tanlash imkoniyatiga ega.
Ideal IPS so'rovga jiddiy mos keladigan hujjatlarni yaratishi kerak va ulardan boshqa hech narsa yo'q. Biroq, amalda bunga erishilmaydi, IPS sukut saqlaydi (tegishli hujjatlarning ma'lum sonini bermaslik) va shovqin (qo'shimcha hujjatlar) kuzatiladi. Hujjatlar to'plami quyidagilarga bo'lingan tomonidan berilgan va berilmagan - bitta mezon bo'yicha va yana tegishli va ahamiyatsiz- boshqacha.
Shunday qilib, har bir so'rov uchun biz 4 ta hujjatlar guruhini olamiz:
Ushbu guruhlarning har birida hujjatlar sonining nisbati ma'lumot olish samaradorligini belgilaydi. Samaradorlikni baholash uchun quyidagi xususiyatlardan foydalaniladi:

Download 34.13 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling