Ilmiy axborot izlash texnalogiyasi


Download 34.13 Kb.
bet3/5
Sana22.06.2023
Hajmi34.13 Kb.
#1645898
1   2   3   4   5
Bog'liq
03. ILMIY AXBOROT IZLASH TEXNALOGIYASI

2. Tezaurus
Tezaurus  - Axborot olish va tabiiy tilning leksik birliklarining maxsus tashkil etilgan normativ lug'ati. Axborot olish tilining leksik birliklari tavsiflovchi . Deskriptor ma'lum bir fan sohasi matni ichidan tanlangan tabiiy tilning kalit so'zlari guruhiga aniq ma'noda mos keladi. Masalan, har qanday (tercihen eng ko'p ishlatiladigan yoki qisqa) kalit so'z yoki ibora yoki raqamli kod deskriptor sifatida tanlanishi mumkin. Tabiiy tilda ko'p qiymatga ega bo'lgan so'z bir nechta tavsiflovchilarga, bir nechta tavsiflovchi so'zlar va iboralar bitta deskriptorga to'g'ri keladi. Tezaurus so'zlar o'rtasidagi semantik munosabatlarni hisobga oladi: antonimlar, sinonimlar, giponimlar, giperonimlar, uyushmalar.
Sinonimlar  - imlo jihatidan farq qiladigan so'zlar (iboralar), lekin bir xil (mavzu doirasida): jodugar = yovuz sehrgarAntonimlar  - qarama-qarshi ma'noga ega so'zlar: yaxshi - jahli chiqdiGiponim  - Boshqa, yanada umumiy tushunchaning alohida holati bo'lgan atama. Giperonim  - atama, aksincha, boshqa bir qator aniq kontseptsiyalar uchun odatiy.
Askar \u003d hiponim ( harbiy); odam\u003d giperonim ( harbiy)
giperonim ( mazali pishiradi) \u003d giperonim ( uyni toza tutadi)=
giperonim ( tikishi mumkin)= yaxshi styuardessa.
"Thesaurus information and monolingual Search" davlat standarti belgilaydi quyidagi turlari ulanishlar:
- jins turlari: transport vositalari - savatuchadigan gilametiklarpechka
- to'liq: devoreshiktovuq oyog'i - qismlar kulbalar;
- sabab-oqibat: qilichni tushirdi - elkalaridan boshini ko'tarish;
- xom ashyo mahsuloti: po'lat - qilich;
- ma'muriy ierarxiya: sulton - vazir - qorovul;
- mavzu jarayoni: bajarmoq - jallod;
- jarayon ob'ekti: bajarmoq - jabrlanuvchi;
- funktsional o'xshashlik: emeli pechka - jip Cherokee;
- mulk - mulk tashuvchisi: olov nafas olish - ajdaho;
- antonimiya;
- sinonimiya.
Assotsiativ munosabat - bu ierarxik munosabatlarga yoki sinonimik munosabatlarga kirmaydigan boshqa munosabatlarning birlashmasi (ya'ni so'zlar o'rtasidagi har qanday munosabatlar, ehtimol juda o'ziga xos, faqat ma'lum bir mavzu sohasida mavjud).
Lug'at yozuvi (norasmiy darajada) quyidagicha ko'rinishi mumkin:
WISE \u003d aqlli
ANTONIM - ahmoq
HIPONIMLAR: bilimli, ma'lumotli, aqlli, yaxshi o'qilgan
VID - razvedka ko'rsatkichi (yuqori)
Tezaurus va grammatikani tashkil qiladi ma'lumot olish tili . Grammatika tilning kelib chiqadigan birliklarini (semantik kodlar, sintagmalar, jumlalar) shakllantirish qoidalarini o'z ichiga oladi va sintaktik munosabatlarni belgilash vositalaridan (masalan, aloqa belgilari) foydalanishni boshqaradi.
Yuqoridagi ajoyib axborot xizmati Tezaurus mijozlarning xatlarida uchraydigan har xil fazilatlar va xususiyatlarni, ularni tasniflash qoidalarini tavsiflashi kerak. Grammatika va tezaurus shunday tuzilishi kerakki, tizim so'rovda ko'rsatilgan sonlarni, aytaylik, sonlarni tushunishini: bo'yi, yoshi yoki tishlar soni (bu kalit so'z bilan aniqlanishi mumkin - o'lchov birligi), mijoz tomonidan taqdim etilgan ma'lumotlarni ajrata olish imkoniyatiga ega bo'lishi kerak. o'zingiz uchun, uning sherigiga bo'lgan talablaridan (iboralar bu erda yordam beradi) men uchrashmoqchimanmos kelishi kerak).
Tezaurus va grammatika qoidalariga asosan hujjat va so'rovning qidiruv rasmlari shakllantiriladi (qidirish tartibi). Retseptni qidirish  - foydalanuvchi so'rovda so'ragan hujjatlarning xususiyatlarini o'z ichiga olgan ma'lumot olish tilidagi matn.

Download 34.13 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling