Мундарижа: I боб. Компьютер луғатлари: тезаурус


Ko‘p tillik axborot-qidiruv tezaurusi


Download 475.5 Kb.
bet24/27
Sana26.02.2023
Hajmi475.5 Kb.
#1233629
1   ...   19   20   21   22   23   24   25   26   27
Bog'liq
kitob yangi oxirgisi

Ko‘p tillik axborot-qidiruv tezaurusi bir necha tillar atamalariga ega bo‘ladi va ularning har birida ma’no jihatidan o‘zaro teng tushunchalarni aks ettiradi. Ko‘p tillik axborot-qidiruv tezaurusining asosiy tuzilish birligi sifatida ularning doimo teng qiymatda ekanligini aks ettiruvchi vositalar bilan bog‘liq bir tillik, o‘zaro teng deskriptorlardan yig‘ilgan va tashkil etuvchi deskriptorning o‘zini qabul qilish mumkin.
Kompyuter lingvistikasida asosiy tillar hisoblangan rus va ingliz tillari bo‘yicha ikki tilli tezaurusni qurish ISO 5964-1985 Xalqaro standartining asosiy me’yoriy nizomlarini inobatga olgan holda ishlab chiqilgan GOST 7.24-2007 Davlatlararo standarti talablariga asosan bajariladi va u ko‘p tillik axborot-qidiruv tezaurusini qurishning asosiy talablari va tuzilmalarini, tarkibini belgilab beradi. Rus-ingliz tezaurusi ko‘p tillik axborot-qidiruv tezaurusining bir tillik to‘plami sifatida ishlab chiqilganida, bir vaqtning o‘zida tezaurus atamalarining ingliz va rus tilidagi versiyalari ko‘riladi.
Bir tillik versiyalarning har biri ISO 2788-1986 Xalqaro standarti, GOST 7.25-2001 Davlatlararo standarti asosida ishlab chiqiladi.
Relyator yani ma’lumotnoma ta’riflanayotgan fan sohasi doirasida omonim terminlarni ma’nolarini farqlash maqsadida kiritilgan belgilarni ifodalaydi. U atamaning bir qismi bo‘lib, uni muayyan bir tushunchaviy kategoriyaga yoki fan sohasiga taalluqliligini ifodalagan holda, mazmunini (ushbu ish doirasida – kompyuter lingvistikasi yoki unga tutash bo‘lgan soha bo‘bilimlarini) ochib beradi. Masalan, MATNNI BELGILASH so‘z birikmasi asosida hosil bo‘lgan ikki tushunchani bir-biridan farqlash uchun JARAYON va OB’YEKT relyatorlari ishlatilishi mumkin. Natijada biz ikki turli descriptor atamaga ega bo‘lamiz, ya’ni MATNNI BELGILASH (JARAYON) va MATNNI BELGILASH (OB’YEKT) sifatida.

  • Berilgan deskriptor atama mansub bo‘lgan soha yoki soha qismi.

  • Deskriptorning tushunchalar ierarxiyasining eng yuqori cho‘qqisida turganligini ko‘rsatuvchi negiz atamaning belgisidir.

Tezaurus atamalari har bir atamaning tanlangan fan sohasi tizimdagi o‘rnini aks ettiruvchi turli semantik munosabatlar bilan bog‘lanadi.
Deskriptorlarni askriptorlar bilan bog‘lash uchun sinonimlar munosabatlaridan foydalaniladi. Shunday qilib, deskriptor har qanday matnda ma’nodosh sifatida qaysidir askriptor o‘rnini bosa olsa, bunda u «sinonim» munosabati bilan bog‘lanadi va sinonimik munosabatni yuzaga chiqaradi; bunda, shuningdek, askriptordan deskriptorga tomon qaytarma munosabat yuzaga keladi – «Qara». GOST 7.25-2001 ga ko‘ra askriptor va deskriptor o‘rtasidagi boshqa munosabatlarni model(andoza)lashtirish uchun tezaurusga askriptor va alternativ deskriptor orasidagi bog‘lanishni belgilash yoki askriptorni deskriptor kombinatsiyalarini ifodalash imkonini beruvchi munosabatlar kiritiladi. Agar deskriptor va askriptorlar o‘rtasida o‘zaro munosabat mavjud bo‘lmasa, u holda askriptorlar va ular bilan almashtiriladigan deskriptorlar o‘rtasida o‘zaro munosabatni ta’minlovchi «Alternativ ravishda foydalan» yoki «kombinatsiyadan foydalan» kabi munosabatlarga murojaat etiladi; bunda «Alternativ tanlovni taqqoslab ko‘r» va «Kombinatsiyani taqqoslab ko‘r» kabi ularga qaytuvchi munosabatlar kiritiladi. Masalan, PARTISIPANT askriptorini SEMANTIK VALENTLIK va VAZIYAT ISHTIROKCHISI deskriptorlari bilan «Alternativ ravishda foydalan» munosabati orqali bog‘lash mumkin. Xuddi shunday, STATISTIK MASIHNA YORDAMIDAGI TARJIMA TIZIMI askriptorini «Kombinatsiyadan foydalan» bog‘lanishi yordamida ikki deskriptorlar kombinatsiyasi (birikmasi) sifatida quyidagicha ifodalanishi mumkin – MASIHNA YORDAMIDAGI TARJIMA TIZIMI va MASIHNA YORDAMIDA STATISTIK TARJIMA.
Deskriptorlar yordamida ifodalanayotgan tushunchalararo semantik bog‘lanishlarning bir tillik ko‘rinish(versiya)larida ierarxik va birikmali munosabatlar o‘rnatiladi.
Deskiptorlar o‘rtasiga quyidagi ierarxik munosabatlar kiritiladi: pastdagi deskriptordan yuqoridagisiga yo‘naltirilgan «Yuqori» darajalanmagan ierarxik bog‘lanishi, pastdagi deskriptor tushunchasi hajmi yuqoridagi deskriptor tushunchasi hajmiga kirgandagi «Yuqori Tur» o‘zaro bog‘liqlik bog‘lanishi, pastdagi deskriptor yuqoridagi deskriptor ob’yekti komponentlaridan birini ifodalaganda ikki deskriptor o‘rtasida «Yuqori Butun» partonimik bog‘lanish. Shuningdek ularning aksi bo‘lgan «Quyi(past)dagi», «Quyidagi Ko‘rinish», «Quyidagi Qism» munosabatlari ham kiritiladi.
Tushunchalar sinfini va shu sinf namunasini ifodalovchi deskriptorlar orasidagi munosabatlarni belgilash maqsadida «Yuqori Namuna Sinfi» va «Quyi Namuna» bog‘lanishlari tanlab olindi.
Ayrim deskriptorlar uchun ierarxik munosabatlarni o‘rnatishda «Ierarxiyaning bo‘linish jihatlari» belgisini ko‘rsatish mumkin. Xuddi shunday, masalan,
1. «Quyidagi Ko‘rinish» munosabati asosida qurilgan ierarxiyada MASHINA YORDAMIDA TARJIMA;
2. «Yondashuv» belgisiga ko‘ra MASHINA YORDAMIDA STATISTIK TARJIMA;
3. QOIDALARGA ASOSLANGAN HOLDA MASHINA YORDAMIDAGI TARJIMA;
4. PRETSENDENTLARGA ASOSLANGAN HOLDA MASHINA YORDAMIDAGI TARJIMAlarga bo‘linadi,
«Insonning ishtiroki darajasi» belgisiga ko‘ra:
1. TO‘LIQ AVTOMATIK TARJIMA;
2.INSON- MASHINA YORDAMIDA TARJIMAga bo‘linadi.
Shunday qilib, aynan bir deskriptor bir vaqtning o‘zida turli bog‘lanishlar asosida qurilgan («Yuqori», «Yuqori Tur», «Yuqori Butun») va ierarxik bo‘linishning turli jihatlariga qarab bir nechta ierarxik tushunchalarga mansub bo‘lishi mumkin.
Deskriptorlar o‘rtasidagi ierarxik munosabatlardan va sinonimik munosabatlardan farq qiluvchi bog‘liqliklar «bilan bog‘liq» munosabati tomonidan belgilanadi. Bunday munosabat deskriptorlar orasida erkin asotsiativ bog‘lanishlar, masalan, «jarayon – ob’yekt», «sabab – oqibat» va boshqa ko‘rinishlardagi tobeliklarni aks ettiruvchi munosabatlarni hosil qilish imkonini beradi.
Bir tildagi versiyalar deskriptorlarining teng ma’noga ega ekanligini ko‘rsatish uchun ular o‘rtasida «boshqa tildagi ekvivalent» munosabati o‘rnatiladi. Agar tushunchani boshqa tilda aynan bir deskriptor yordamida ifodalash imkoni bo‘lmasa, unda GOST 7.24-2007 ga muvofiq ekvivalent sifatida bir necha deskriptorlar kombinatsiyasi ko‘rsatiladi.
Tezaurusga kiritilgan atamalarning muhimligini tasdiqlash va tezaurusdan foydalanuvchilarni ulardan foydalanish tajribasi bilan tanishtirish maqsadida har bir atama uchun uning manbalari, ya’ni ushbu atama uchraydigan yoki ifodalanadigan matnli hujjatlar yoki matnli hujjatlar to‘plami bilan bog‘lanishi belgilanadi.
Buning uchun ikki munosabat xizmat qiladi: manba – matnlar to‘plami bo‘lsa, atamaning manbada takrorlanish darajasini ko‘rsatishi mumkin bo‘lgan «...da uchraydi» bog‘lanishi va ushbu atama manbaning predmetga oid yo‘riqnomasida yoki glossariy(biror tekstdagi notanish, tushunilishi qiyin so‘zlar lug‘ati)da uchrashi bu atamaning muhimligini ko‘rsatuvchi va unga bo‘lgan ishonchni oshishini belgilovchi «hujjat qismlarida uchraydi» bog‘lanishi. Izoh-ta’riflar bilan ta’minlangan deskriptor atamalar manba bilan «...da ta’rif beriladi» munosabati yordamida bog‘lanadi.
Tezaurusda manbalar quyidagi parametrlar bilan ta’riflanadi: nomlanishi, bibliografik izoh, til, tur (kitob, monografiya, ilmiy maqola, hujjatlar to‘plami, darslik, lug‘at, tezaurus, internet-manbalar, matnlar to‘plami va b.), internet tarmog‘idagi manzil va qisqa ta’rif. Matnlar to‘plami uchun esa qo‘shimcha ravishda matnlar soni va so‘zlar qo‘llanilishi beriladi.
Tezaurusni elektron manba sifatida ifodalash maqsadida ma’lumotlarning ikki darajali ombori (saqlash joyi) ishlab chiqiladi, ilova sifatida esa tezaurus muharriri yaratiladi.
Birinchi darajada atamalararo belgilanadigan tezaurus maqolalari sxemasini, turlarini va munosabatlarining xususiyatlarini, shuningdek, atamalar manbalarining ta’riflari va ularning izohlarini belgilovchi tezaurus tuzilmasi turadi. Tezaurus tuzilmasining yaratilishi va sozlanishi tezaurus muharririning maxsus bo‘limida amalga oshiriladi. Jumladan, bunda atamalar sinfi va atamalar manbalarining turlari, shuningdek, munosabatlar to‘plami va ularning xususiyatlari belgilanadi (izohlanadi). Vaholanki, munosabatlarning, nafaqat argumentlari turini va munosabatlarning sonini cheklash vazifalarini ko‘rsatish yo‘li bilan amalga oshiriladigan tuzilmali xususiyatlari, balki rasmiy xususiyatlarini ham belgilash mumkin.
Ikkinchi daraja tezaurus maqolalarini va manbalar ta’riflarini saqlashni ta’minlaydi. Atamalarni, ularning izohlarini va manbalarini yuklash, shuningdek, ular o‘rtasida aloqa o‘rnatishda tezaurus muharriri tilshunos-ekspertlar uchun qulay interfeys yaratib beradi. Shuni ta’kidlaymizki, atamalar ta’riflarini, manbalar va ular o‘rtasidagi bog‘liqliklarni kiritish va yoki tahrir qilish tugallanishi bilan tezaurusning foydalanuvchilariga veb-interfeysi orqali yangi axborotlarni ko‘rish imkoni yaratiladi.
Tezaurus muharriri veb-ilova sifatida amalga oshiriladi va ro‘yxatga olingan foydalanuvchilarga Internet orqali foydalanish imkoni mavjud bo‘ladi. Taqsimlangan jamoa holida ishlab chiqish (yaratish)ni ta’minlash maqsadida tezaurus muharririda turli darajadagi ekspertlar xuquqini himoya qiluvchi vakillar saqlanadi. Bu mexanizmga ko‘ra faqatgina eng yuqori daraja ekspertlari tezaurus tuzilmasini tahrir qilishlari mumkin, boshqa daraja ekspertlari esa faqatgina uning tarkibi(mazmuni)ni (atamalarning ta’rifi va manbalarini) tahrir qilishlari mumkin. Bunda quyidagi cheklovlar mavjud: ikki ekspert (foydalanuvchi) bir vaqtning o‘zida aynan bir maqolani (yoki manba ta’rifini, yoki atamani) tahrir qila olmaydilar.
Bundan tashqari, lug‘at manbasini faqatgina muallifning o‘zigina tahrir qilishi mumkin degan qoida ham mavjud. Agar ekspertlardan biri boshqa «birov»ning atamasiga qo‘shimcha yoki umuman o‘zgartirish kiritmoqchi bo‘lsa, buni muallif bilan kelishib olishi va elektron tezaurusda ilova sifatida keltirilgan maxsus forum orqali amalga oshirishi mumkin.
Tezaurus matnli hujjatlarni indekslash(kodlash)i va qidirishda foydalanilishi uchun fan sohasining yaxlit va bir-biriga zid bo‘lmagan tushunchalar tizimini ifodalashi lozim. Bu atamalar muharririga kiritilgan, tezaurus tushunchalari tizimining mantiqiy yaxlitligini ta’minlovchi va chiqarib beruvchi mexanizmlar tomonidan amalga oshiriladi. Ularning vazifasi tezaurus muharririda aksioma va cheklovlar sifatida ifodalangan tezaurus munosabatlarining ta’riflariga asoslanadi.
Jumladan, ushbu xususiyatlar asosida tezaurus atamalari o‘rtasidagi maqbul bog‘lanishlar o‘rnatish hodisasi yuz beradi, zaruriyat tug‘ilganda esa ular avtomat tarzda qo‘shimcha qilinishi va/yoki o‘chirib tashlanishi mumkin. Bundan tashqari, u yoki bu sinfga mansubligiga ko‘ra tezaurus atamalari o‘rtasidagi u yoki bu bog‘lanishlar mavjud bo‘lishi va ularning soniga nisbatan cheklovlar tartibga solinadi.
Masalan, sal avvalrog‘da ko‘rilgan «Qara» munosabatiga qaytuvchi munosabat («sinonim») keltirilgan va mavjud munosabatlar cheklangan bo‘lsa («ushbu turning har bir askriptor atamasi uchun faqat birgina bog‘lanish»), u holda AVTOMATIK TARJIMA askriptori va MASHINA YORDAMIDAGI TARJIMA deskriptori bilan bog‘langanda sinonim qaytuvchi bog‘lanishining yaratilishi sodir bo‘ladi (MASIHNA YORDAMIDA TARJIMA, AVTOMATIK TARJIMA) (agar bunday ko‘rinish hali mavjud bo‘lmasa), shuningdek, AVTOMATIK TARJIMA askriptoriga boshqa deskriptorlar bilan «Qara» va «Sinonim» bog‘lanishlarini yaratishiga cheklov ta’minlanadi (qo‘yiladi).
Elektron tezaurusdan foydalanishni osonlashtirish maqsadida foydalanuvchiga tezaurus tarkibidagi ma’lumotlarni foydalanuvchiga tarmoq ichida o‘zaro bog‘langan ob’yektlar, ya’ni tezaurus elementlari – atamalar (deskriptorlar va askriptorlar), atamalar manbalarining ta’riflari va ularning tavsiflari sifatida aks ettiruvchi foydalanuvchi veb-interfeysi yaratildi. Atamalarning o‘ziga xos xususiyatlari to‘plami va ular o‘rtasida o‘rnatilgan bog‘lanishlari yuqorida ta’riflangan tezaurus tuzilmasiga muvofiqdir.
Tezaurusda qidiruv jarayoni foydalanuvchi uchun kerakli bo‘lgan atamalarni tanlash, ularning ta’riflarini (tezaurus maqolalarini) barcha tafsilotlari bilan birga ko‘rib chiqish, shuningdek, atama yoki, uning ta’rifi uchrashi mumkin bo‘lgan manbalar (nashrlar va matnlar to‘plami) ta’riflari bilan tanishish imkonini beradi.
Foydalanuvchi uni axborotning qaysi turi qiziqtirayotganini, ya’ni barcha atamalarni, deskriptorlarni, askriptorlarni yoki atamalar manbalarini ko‘rsatishi mumkin. Bunda unga tanlangan ob’yekt turi bo‘yicha tezaurusda mavjud bo‘lgan axborot to‘liq holda, ushbu ob’yektga yo‘llanmalar to‘plamiga ega bo‘lgan html-sahifa sifatida aks ettiriladi.
Muayyan ob’yekt va uning bog‘lanishlari haqidagi axborot ham html-sahifa sifatida aks ettiriladi. Bunda axborot bog‘langan ob’yektlarning sahifasida giperilova (giperssilka) ko‘rinishida aks ettiriladi va ular yordamida ob’yektlarning mayda tafsilotlarini ko‘rishga o‘tish mumkin bo‘ladi.
Tezaurus bo‘ylab keyingi yo‘naltirish tezaurusning bir ob’yektlaridan ular o‘rtasida mavjud bo‘lgan tezaurus (atamalar o‘rtasida) yoki bibliografik (atamalar va manbalar o‘rtasidagi) munosabatlarni aks ettiruvchi bog‘lanishlarni inobatga olgan holda boshqa ob’yektlarga o‘tish jarayonini aks ettiradi.

Download 475.5 Kb.

Do'stlaringiz bilan baham:
1   ...   19   20   21   22   23   24   25   26   27




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling