Ilmiy axborot izlash texnalogiyasi


Download 34.13 Kb.
bet2/5
Sana22.06.2023
Hajmi34.13 Kb.
#1645898
1   2   3   4   5
Bog'liq
03. ILMIY AXBOROT IZLASH TEXNALOGIYASI

Indekslash  - ma'lumotni olish tilida markaziy mavzuni yoki matn mavzusini yoki ob'ekt tavsifini ifoda etish.
Mavzu  - hujjat / ma'lumot so'rovida ko'rib chiqilgan yoki qayd etilgan ob'ekt (moddiy narsa, tushuncha, mulk yoki munosabatlar).
Mavzu  hujjat / ma'lumot so'rovi - fan yoki texnologiya, amaliy faoliyat sohasi yoki hujjat / ma'lumot so'rovi bag'ishlangan muammo.
Qidiruv massivi va berilgan ma'lumotlarning xarakteriga ko'ra IPS bo'linadi hujjatli  va haqiqiy .
Hujjatli IPS  o'z ichiga olgan hujjatlarni (maqolalar, kitoblar, hisobotlar, mualliflik guvohnomalari va patentlarning tavsiflari) qidirish uchun mo'ljallangan kerakli ma'lumotlar. Bunday IPS-ning qidirish qatori hujjatlarni qidirish rasmlaridan (ya'ni, har biri hujjatning asosiy tarkibini uzatadigan elementlardan) yoki hujjatlarning o'zidan iborat. Taqdim etilgan ma'lumot so'roviga javoban, IPS kerakli ma'lumotlarni o'z ichiga olgan hujjatlar to'plamini (yoki ularning saqlash manzillarini) chiqaradi. Hujjat - bu mantiqiy to'liqligi bo'lgan va uning manbai va / yoki yaratuvchisi to'g'risidagi ma'lumotlarni o'z ichiga olgan har qanday mazmunli matn.
Faktografik IPS  iste'molchi tomonidan so'ralgan axborot so'rovida to'g'ridan-to'g'ri dolzarb ma'lumotlarning berilishini ta'minlaydi. Qidiruv qatori haqiqiy yozuvlardan iborat, ya'ni. hujjatlardan olingan va rasmiy tilda taqdim etilgan faktlarning tavsifidan.
Masalan, agar Tanishuv Xizmati hujjatli IPS yaratishga qaror qilsa, qidiruv qatori bevosita o'z mijozlarining xatlaridan iborat bo'ladi: "Mening ismim Ilya Muromets. Men 33 yil pechda o'tirdim va endi shoh soqchilardadir ...".Haqiqiy IPSni yaratish uchun, mijozlarning xatlariga ko'ra, shakl jadvallari to'ldiriladi: "Familiyasi - Muromets. Ismi - Ilya. Yoshi - 33. Lavozimi - xavfsizlik". Shunga ko'ra, birinchi holda, so'rov mijozning sherigiga oid istaklari bo'lgan xatning bir qismi bo'ladi: "Men kelin mendan yoshroq bo'lishini xohlayman, lekin men dono va uy ishlariga qiziqaman", ikkinchisida - undan tuzilgan jadval: "Yoshi - 33, aql - yuqori, qiziqishlari - uy".
Hozirgi vaqtda haqiqiy IPS (qidiruv tizimlarining maxsus sinfi sifatida) deyarli ishlab chiqilmagan, ular bajaradigan amallar muntazam ma'lumotlar bazasidan foydalanib amalga oshiriladi. Bundan tashqari, IPS haqida gap ketganda, biz hujjatli ma'lumotlarni olish tizimini yodda tutamiz.
Hujjatni tizimning ichki tiliga tarjima qilishning eng mashhur usullaridan biri bu koordinatali indeksatsiya  - ishga qabul qilish to'g'risidagi hujjatni tayinlash kalit so'zlar yoki uning tarkibini belgilaydigan kodlar. Indekslashning ikkita usuli mumkin: bepul, kalit so'zlar to'g'ridan-to'g'ri hujjat matnidan ularning shakllari va ular o'rtasidagi munosabatlarni hisobga olmasdan to'g'ridan-to'g'ri chiqarilganda; va faqat hujjatning qidirish rasmiga yozilgan so'zlar kiritilganida boshqariladi ma'lumot qidirish tezaurusi bu erda ularning sinonim, morfologik va assosiativ aloqalari ko'rsatilgan.

Download 34.13 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling