Мундарижа: I боб. Компьютер луғатлари: тезаурус


Download 475.5 Kb.
bet22/27
Sana26.02.2023
Hajmi475.5 Kb.
#1233629
1   ...   19   20   21   22   23   24   25   26   27
Bog'liq
kitob yangi oxirgisi

Kompyuter lingvistikasi o‘zbek tilshunosligidagi yangi yo‘nalishlardan biridir. Hozirgi kunda o‘zbek tilshunosligida kompyuter lingvistikasiga oid qator tadqiqotlar yuzaga kelmoqda. O‘z navbatida, soha oldida turgan muammolar, hal qilinishi lozim masalalar anchagina. Shulardan biri kompyuter lingvistikasi atamalarini jamlash, izohlash, kompyuter leksikografiyasini shakllantirish, o‘zbek tilidagi kompyuter lug‘atlarini yaratish, ma’lumotlar bazasi sifatida ahamiyatli bo‘lgan tezauruslar tuzish bilan bog‘liqdir.
Zamonaviy kompyuter lingvistikasi atamalarining to‘liq ixcham to‘plamini nafaqat O‘zbekistonda, balki Rossiyada va hatto chet el olimlarining izlanishlarida ham uchratmaymiz. Aslida rus manbalaridan lingvistika ham bir necha asosiy manbalarda, jumladan, «Lingvistik ensiklopedik lug‘at»da (LES), O.S.Axmanov lug‘atida va an’anaviy lingvistika uchun yangilik bo‘lgan maqolalar nashr etiladigan «Krugosvet» internet-ensiklopediyasida aks ettirilgan. 2007 yilda RFAda yaratilgan tilshunoslik tezaurusi ushbu fan bo‘limlariga tegishli 3000 ga yaqin atamani o‘z ichiga olgan. O‘zining barcha afzalliklariga qaramasdan bu tezaurus, avvalambor, bibliografik qidiruvga mo‘ljallangan, shuning uchun uning lug‘aviy atamalar ta’rifi (defenitsiya)lariga ega emas. Bundan tashqari, RFA da yaratilgan tezaurus bir tillik va aynan kompyuter lingvistikasi atamalari uning uncha katta bo‘lmagan qismiga to‘g‘ri keladi (kompyuter lingvistikasi sohasiga tegishli bo‘lgan atamalar tezaurusda keltirilgan atamalar umumiy hajmining 4% iga teng). O‘z-o‘zidan ko‘rinib turibdiki, anchagina ilmiy izlanishlar olib borgan Rossiya va boshqa chet davlatlarda ham kompyuter lingvistikasining atamalari to‘g‘risida to‘liq holatdagi, zamonaviy atamalarni ham qamrab olgan lug‘atlar yaratilmagan.
Kompyuter lingvistikasi atamalari ta’riflari Rossiyadagi «Sun’iy intellekt» nomli lug‘atda ham mavjud. Biroq u 1980-yillar oxirilaridagi atamalarni aks ettiradi. Bundan tashqari u kompyuter lingvistikasiga oid atamalarning kam qismini qamrab oladi va unda keltirilgan atamalar kompyuter lingvistikasi nuqtai nazaridan emas, balki sun’iy intellekt nuqtai nazaridan izohlangan.
Kompyuter lingvistikasi fanlararo bog‘lanishga ega bo‘lganligi sababli uning atamalarini umumiy ensiklopediyalarda ham topish mumkin. Masalan, «Katta ensiklopedik lug‘at»dan (BES) ma’lumot olsa bo‘ladi. Hozirgi kunda kompyuter lingvistikasi bilimlari bo‘yicha eng mashhur manba – bu kompyuter lingvistikasi tushunchalarining ko‘p qismiga izohlar, darajalashlar va manbalarga ko‘rsatmalar topish mumkin bo‘lgan Vikipediyadir. Biroq bu ma’lumotlar ko‘pincha bir tomonlama, to‘liq emas va ularning ko‘pi xomakidir.
Shunday qilib, hozirgi kunda kompyuter lingvistikasining barcha atamalariтш bir tizimga birlashtirgan manba mavjud emas. Bu sezilarli va afsuslanarli bo‘shliqni, kompyuter lingvistikasining ingliz va rus yoki rus – o‘zbek tilidagi atamalari hamda ularning izohlarini qamrab olgan ikki tillik tezaurus to‘ldirgan bo‘lar edi. Bunday tezaurus bilimlarning shu sohasiga tegishli atamalar to‘g‘risidagi ma’lumotlarni to‘plash va bir tizimga solish imkonini yaratadi, ma’lumot manbalari, shu tizimdagi axborotlarni ma’nosiga qarab qidirish imkoni mavjud bo‘ladi. Bundan tashqari, ushbu tezaurus nafaqat kompyuter lingvistikasi sohasining bo‘lg‘usi mutaxassislarini, balki, umuman axborot texnologiyalari sohasi mutaxassislari ishlarini ham ancha yengillashtirib, bilim darajalarining oshirilishiga imkoniyat yaratgan bo‘lar edi.
Qancha tilga yo‘naltirilganligiga qarab tezauruslar bir tillik va ko‘p tillik bo‘lishi mumkin.
Kompyuter lingvistikasi bo‘yicha ikki tilli tezaurus tuzilmasini loyihalashtirish mavjud axborot-qidiruv tezauruslari qurilishini qat’iy belgilab beruvchi xalqaro standartlar asosida, shuningdek, INION tomonidan hozirgi kunga qadar to‘plangan tezauruslarni ishlab chiqishdagi tajribalarini tahlil qilish va umumlashtirish asosida amalga oshirilgan.
Ikki til asosida tezaurus yaratish tadqiqotchilarga keng imkoniyat yaratadi.
Tezauruslarni yaratishda o‘zbek tili xususiyatlarini hisobga olish lozim bo‘ladi. Har bir til birligiga oid tushunchalar tezaurusini berishda ularning nutqdagi ahamiyatlilik darajasidan kelib chiqib yondashailadi. Turkiy tillarda, jumladan o‘zbek tilida fe’llar fikr ifodalashda muhim o‘rin tutadi. Shu bois o‘zbek tilidagi fe’llar tezaurusini boshqa tillarga qiyoslagan holda yaratish tilning ijtimoiy funksiyasini oshirishda, axborot uslubini shakllantirishda va takomillashtirishda muhim o‘rin tutadi.
Tezaurus tuzishda, dastavval, kompyuter lingvistikasi bo‘yicha tezaurus yaratishga yondashuvlar o‘rganiladi. Tezaurusning umumiy tuzilmasi, tezaurusli manbalar strukturasi va atamalar orasidagi bog‘liqliklar to‘plami izohlanmog‘i lozim. Atamalar o‘rtasidagi munosabatlarni tanlash va aks ettirishdagi muammolarga, shuningdek, tezaurus terminologik (atamalar) tizimining mantiqiy bir butunligini ta’minlanishiga alohida e’tibor qaratish kerak.
Tezaurusning mukammal variantini yaratishda Rossiya va Xalqaro standartlar asosida tezaurusga kiritilishi mumkin bo‘lgan asosiy birliklarni va ular o‘rtasidagi munosabatlar to‘plamini, leksik birliklar turlarini yig‘ish qoidalarini o‘rnatish, so‘zlarni shakllantirish, so‘z manbalarini tuzish va axborot-qidiruv tezauruslarini rasmiylashtirish ishlarini olib borish lozim.
Tezaurusning asosiy atamalari fanda deskriptor va askriptorlarga bo‘linadi. Davlat standartlariga asosan axborot-qidiruv tezaurusiga leksik birliklarning quyidagi turlari kiritiladi: yakka so‘zlar (otlar, sifatlar, fe’llar, ravishlar), nom(ot)ga oid so‘z birikmalari, murakkab so‘zlarning leksik qiymatga ega komponentlari, so‘z va so‘z birikmalarining qisqartmalari kiritiladi. Leksik birliklar axborot-qidiruv tezauruslarida, agarda bir leksik birlikning ikkinchisiga almashtirilishi, qidirilayotgan axborot matni ma’nosining o‘zgarib ketishiga olib kelmasa, ekvivalent holatni tashkil qilgan holda, ekvivalent deb e’lon qilinadi. Ekvivalentlik sinfining leksik birliklaridan biri ushbu sinf vakili sifatida tanlab olinadi va deskriptor maqomini oladi, qolgan leksik birliklar esa askriptor maqomini oladilar. Bunda, shuningdek, abbreviatura (qisqartma so‘z) yoki yozuvning boshqa ko‘rinishlari bilan tasvirlangan (chiziqcha orqali, bo‘sh joy bilan (probel) va b.) atamalar ham askriptor maqomini oladi. Shu o’rinda ko’rinib turibdiki, dekriptorlar tezaurus tarkbining asosini tashkil etuvchi so’zlar yig’indisidan iborat bo’ladi. Askriptorlar esa uning ma’nosiga deyarli teng bo’gan so’zlar yig’indisidan iborat bo’ladi.
Axborot-qidiruv tezauruslarini, o‘z tarkibiga ko‘ra, barcha birliklari deskriptor yani, maqbul bo‘lgan, asosiy mazmunni tashuvchi va askriptor yani, maqbul bo‘lmagan, q’shimcha so’z o’rnida turuvchi atamalarni aks ettiruvchi tezauruslarga ajratadilar. Bunda deskriptorlar hujjatlarni indekslashda va qidiruv so‘rovnomalarida ishlatilishi, askriptorlar esa (matnga kirish sifatida) bir yoki bir necha deskriptorlar bilan almashtirilishi lozim bo‘ladi.
Tezaurusning lug‘at manbasi tarkibiga o‘z maqomidan qat’iy nazar yana quyidagi elementlar ham kiritiladi:
1   ...   19   20   21   22   23   24   25   26   27




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling