Мундарижа: I боб. Компьютер луғатлари: тезаурус
Download 475.5 Kb.
|
kitob yangi oxirgisi
Atama, so‘z, tildagi (fandagi)so‘z birikmasi yoki tildagi murakkab so‘zlarning leksik ahamiyatga ega bo‘lgan tarkibiy qismini aks ettiradi..
atamalar nomi qaysi tilda berilayotganligi. atamalardan foydalanish qoidalari va tavsiyalarini, shuningdek, lug‘at muallifining fikr-mulohazalarini va izohlarini o‘z ichiga oluvchi sharhlar. lug‘at muallifi – bu tezaurusning jamoaviy ishlab chiqish jarayonini nazorat qilish maqsadida beriladi. Deskriptor atamalar yuqorida keltirilgan alomatlardan tashqari quyidagi qo‘shimcha alomatlar bilan ham ifodalanadi: atamani ifodalash, ya’ni atamaning ushbu tildagi ma’nosi yoki mazmunini izohlash. Tezaurusda atamalar ifodasining mavjudligi uni nafaqat qo‘l vositasida yoki avtomatlashtirilgan holda indekslash imkonini beradi, balki ushbu fan sohasidagi bilimlarining tizimlashtirilgan manbai sifatida foydalanish imkonini ham yaratadi. Quyidagi atamalarga e’tiborimizni qaratadigan bo‘lsak, relyator (ma’lumotnoma) – ta’riflanayotgan fan sohasi doirasida omonim terminlarni ma’nolarini farqlash maqsadida kiritilgan belgilarni ifodalaydi. U atamaning bir qismi bo‘lib, uning muayan tushunchaviy kategoriyaga yoki fan sohasiga taalluqliligini ifodalagan holda mazmunini (ushbu ish doirasida - kompyuter lingvistikasi yoki unga tutash bo‘lgan soha bo‘limlari bilimlarini) ochib beradi deskriptorning tushunchalar ierarxiyasining eng yuqori cho‘qqisida turganligini ko‘rsatuvchi negiz atamaning belgisidir. Tezaurus atamalari har bir atamaning tanlangan fan sohasi tizimidagi o‘rnini aks ettiruvchi turli semantik munosabatlar bilan bog‘lanadi. Deskriptorlarni askriptorlar bilan bog‘lash uchun sinonimlar munosabatlaridan foydalaniladi. Deskriptor har qanday matnda, ma’nodosh sifatida qaysidir askriptor o‘rnini bosa olsa, bunda u «sinonim» munosabati bilan bog‘lanadi va sinonimik munosabatni yuzaga chiqaradi; bunda, shuningdek, askriptordan deskriptorga tomon qaytarma munosabat yuzaga keladi. Agar deskriptor va askriptorlar o‘rtasida o‘zaro munosabat mavjud bo‘lmasa, u holda askriptorlar va ular bilan almashtiriladigan deskriptorlar o‘rtasida o‘zaro munosabatni ta’minlovchi «Alternativ ravishda foydalan» yoki «kombinatsiyadan foydalan» kabi munosabatlardan foydalaniladi; bunda «Alternativ tanlovni taqqoslab ko‘r» va «Kombinatsiyani taqqoslab ko‘r» kabi ularga qaytuvchi munosabatlar kiritiladi. Deskriptorlar yordamida ifodalanayotgan tushunchalararo semantik bog‘lanishlarni bir tillik ko‘rinish(versiya)larda ierarxik va birikmali munosabatlar o‘rnatiladi. Deskriptorlar o‘rtasidagi, ierarxik munosabatlardan va sinonimik munosabatlardan farq qiluvchi bog‘liqliklar «bilan bog‘liq» munosabati tomonidan belgilanadi. Bunday munosabat deskriptorlar orasida erkin assotsiativ bog‘lanishlar, masalan, «jarayon-ob’yekt», «sabab-oqibat» va boshqa ko‘rinishlardagi tobeliklarni aks ettiruvchi munosabatlarni hosil qilish imkonini beradi. Turli tildagi versiyalardagi deskriptorlarning teng ma’noga ega ekanligini ko‘rsatish uchun ular o‘rtasida «boshqa tildagi ekvivalent» munosabati o‘rnatiladi. Agar tushunchani boshqa tilda aynan bir deskriptor yordamida ifodalash imkoni bo‘lmasa, unda standartga muvofiq ekvivalent sifatida bir necha deskriptorlar kombinatsiyasi ko‘rsatiladi. Tezaurusga kiritish uchun atamalar tanlash muammolari, shuningdek, bir qancha sinonimik atamalar orasidan asosiy Deskriptor atamani tanlab olish masalalari ushbu mavzu ustida ko‘proq ish olib borishni talab qiladi. Tezaurusning elektron ko‘rinishi (versiyasi) amalga oshirilishining o‘ziga xos xususiyatlari tasvirlash, bunda asosiy e’tibor tezaurusda qo‘llanadigan atamalar haqidagi ma’lumotlar tizimining mantiqiy bir butunligini va uning ichidagi ma’lumotlaridan foydalanishning qulayligini ta’minlashga qaratiladi. Hozirgi kunda, o‘z ichiga matnlardan axborotni ajratib olish usullari haqidagi bilimlarni, hujjatlarni mazmuniga qarab qidirish va indekslash, tilga oid qurilmalar, jumladan, nutqiy interfeyslar haqidagi bilimlarni o‘z ichiga olgan ilmiy-amaliy fan sifatida kompyuter lingvistikasiga bo‘lgan e’tiborning ortib borayotganligi kuzatilmoqda. Shu sababli kompyuter lingvistikasi atamalari bo‘yicha shuni alohida ta’kidlash lozimki, bir tarafdan ta’lim darajasini oshirilishiga, boshqa tarafdan esa kompyuter lingvistikasi bo‘yicha nashrlarni indekslash uchun foydalaniladigan, ya’ni ularda aks ettirilgan kompyuter lingvistikasi bo‘yicha bilimlardan foydalanishni osonlashtirish maqsadida yoki sodda avtomatlashtirilgan, yoki avtomatik ravishda ishlaydigan, sistemalashtirilgan bilimlarga katta ehtiyoj sezilmoqda. Hozirgi vaqtda kompyuter lingvistikasida aniq va umum qabul qilingan ilmiy atamalar tizimi mavjud emas, chunki zamonaviy kompyuter lingvistikasining ko‘p atamalari o‘zbek va hatto rus tilidagi mavjud lingvistik manbalarda qayd etilmagan. 1978 yilda S.E.Nikitina tomonidan yaratilgan, lingvistika bo‘yicha nazariy va amaliy tezaurus eskirgan va iste’moldan chiqmoqda. Bundan tashqari u bir tilda bo‘lib, mavjud tushunchalar ta’rifga ega emas. V.Z.Demyankovning atamalar lug‘ati esa izohlarga ega va ikki tilda, ammo u ham ushbu ilmiy sohaning zamonaviy tasvirini aks ettirmaydi. Ko‘rinadiki, o‘zbek tili leksikasi tarkibining faol qismini tashkil qiluvchi fe’llar tezaurusini yartishda kompyuter tizimidagi ma’lumotlar bazasi, terminlar lug‘ati, boshqa lug‘at turlari o‘ziga xos o‘rin tutadi. Bir sohadagi muammoni hal etish boshqa yo‘nalishdagi muammoning hal etilishi bilan bog‘liq. Shunday ekan, o‘zbek tilshunosligining kompyuter lingvistikasiga doir muammolari qisqa davrda hal etilishi mushkul bo‘lgan, yaxlit tizim holatidagi ilmiy tadqiqotlarni talab etadigan masalalar ekanligi ma’lum bo‘ladi. O’zbek tili leksikasining tarkibiy faol qismi hisoblangan fe’llar va ularning holat shaklini ko’radigan bo’lsak, bu anchaginani tashkil etadi, sababi o’zbek tilida gaplar fe’llarsiz tuzilmaydi, ayniqsa, holat fe’llari har bir fe’l tarkibida mavjud bo’ladi. Inson harakat qilayotganida ham qandaydir bir holat ostida bo’ladi. Hozirgi kunda, o‘z ichiga matnlardan axborotni ajratib olish usullari haqidagi bilimlarni, hujjatlarni mazmuniga qarab qidirish va indekslash, tilga oid qurilmalar, jumladan, nutqiy interfeyslar haqidagi bilimlarni o‘z ichiga olgan ilmiy-amaliy fan sifatida kompyuter lingvistikasiga bo‘lgan e’tiborning ortib borayotganligi kuzatilmoqda. Shu sababli kompyuter lingvistikasi atamalari bo‘yicha shuni alohida ta’kidlash lozimki, bir tarafdan ta’lim darajasi oshirilishiga, boshqa tarafdan esa kompyuter lingvistikasi bo‘yicha nashrlarni indekslash uchun foydalaniladigan, ya’ni ularda aks ettirilgan kompyuter lingvistikasi bo‘yicha bilimlardan foydalanishni osonlashtirish maqsadida yoki sodda / avtomatlashtirilgan, yoki avtomatik ravishda ishlaydigan, sistemalashtirilgan bilimlarga katta ehtiyoj sezilmoqda. Ammo hozirgi vaqtda kompyuter lingvistikasida aniq va umum qabul qilingan ilmiy atamalar tizimi mavjud emas, chunki zamonaviy kompyuter lingvistikasining ko‘p atamalari o‘zbek va hatto rus tilidagi mavjud lingvistik manbalarning hech birida ifoda etilmagan. 1978 yilda S.E.Nikitina tomonidan yaratilgan lingvistika bo‘yicha nazariy va amaliy tezaurus eskirgan va iste’moldan chiqmoqda. Bundan tashqari u bir tilda bo‘lib, mavjud tushunchalar ta’rifga ega emas. V.Z.Demyankovning atamalar lug‘ati esa izohlarga ega va ikki tilda, ammo u ham ushbu ilmiy sohaning zamonaviy tasvirini aks ettirmaydi. Zamonaviy kompyuter lingvistikasi atamalarining to‘liq ixcham to‘plami nafaqat O‘zbekistonda, balki Rossiyada va hatto chet elda ham mavjud emas. Aslida rus manbalaridan lingvistika ham bir necha asosiy manbalarda, jumladan, «Leksik ensiklopedik lug‘at»da (LEL), O.S.Axmanov lug‘atida va tarkibida an’anaviy lingvistika tushunchalari uchun yangi maqolalar mavjud bo‘lgan «Krugosvet» internet-ensiklopediyasida aks ettirilgan. 2007 yilda Rossiya Fanlar Akademiyasi qoshidagi INIONda yaratilgan tilshunoslik tezaurusi ushbu fan bo‘limlariga tegishli 3000 ga yaqin atamani o‘z ichiga olgan. O‘zining barcha afzalliklariga qaramasdan bu tezaurus, avvalamborб bibliografik qidiruvga mo‘ljallangan, shuning uchun uning lug‘aviy atamalari ta’rif(defenitsiya)larga ega emas. Bundan tashqari, INION tezaurusi bir tillik va aynan kompyuter lingvistikasi atamalari uning uncha katta bo‘lmagan qismiga to‘g‘ri keladi (kompyuter lingvistikasi sohasiga tegishli bo‘lgan atamalar tezaurusda keltirilgan atamalarning umumiy hajmining 4%ga teng). O‘z-o‘zidan ko‘rinib turibdiki, anchagina ilmiy izlanishlar olib borgan Rossiya va boshqa chet davlatlarda kompyuter lingvistikasining atamalari to‘g‘risida to‘liq holatdagi, zamonaviy atamalarni ham qamrab olgan lug‘atlar yaratilmagan, bizning yurtimiz uchun esa bu hali yangi soha hisoblanib, qilinishi lozim bo‘lgan ishlar anchagina ekanligini ko‘rsatadi. Kompyuter lingvistikasi atamalari ta’riflari Rossiyadagi sun’iy intellekt lug‘atida ham mavjud. Biroq u 1980 yillar oxirilaridagi atamalarni aks ettiradi. Bundan tashqari u kompyuter lingvistikasiga oid atamalarning kam qismini qamrab oladi va unda keltirilgan atamalar kompyuter lingvistikasi nuqtai nazaridan emas, balki sun’iy intellekt nuqtai nazaridan izohlangan. Kompyuter lingvistikasi fanlararo bog‘lanishga ega bo‘lganligi sababli uning atamalarini umumiy ensiklopediyalarda ham topish mumkin, masalan, «Katta ensiklopedik lug‘at»da (БЭС) ma’lumot olsa bo‘ladi. Hozirgi kunda kompyuter lingvistikasi bilimlari bo‘yicha eng mashhur manba – bu kompyuter lingvistikasi tushunchalarining ko‘p qismiga izohlar, darajalashlar va manbalarga ko‘rsatmalar topish mumkin bo‘lgan Vikipediyadir, biroq bu ma’lumotlar ko‘pincha bir tomonlama, to‘liq emas va xomaki bo‘ladi. Shunday qilib, hozirgi kunda kompyuter lingvistikasining barcha atamalari bir tizimga birlashtirilgan manba mavjud emas. Agar shunaqangi manba ustida olimlarimiz izlanishlar olibborsalar ba albatta, sezilarli bo‘shliqni, kompyuter lingvistikasining ingliz va rus yoki rus – o‘zbek tilidagi atamalari hamda ularning izohlarini qamrab olgan ikki tillik tezaurusni to‘ldirgan bo‘lar edi. Bunday tezaurus bilimlarning shu sohasiga tegishli bo‘lgan atamalar to‘g‘risidagi ma’lumotlarni to‘plash va bir tizimga solish imkonini yaratadi, ma’lumot manbalari va shu tizimdagi axborotlarni ma’nosiga qarab qidirish imkoni mavjud bo‘ladi. Bundan tashqari, ushbu tezaurus nafaqat kompyuter lingvistikasi sohasining bo‘lg‘usi mutaxassislari, balki, umuman axborot texnologiyalari sohasi mutaxassislarining ham ishlarini ancha yengillashtirib, bilim darajalarini oshirilishiga imkoniyat yaratgan bo‘lar edi. Nafaqat o‘zimizning tilimizda, balki ikki til asosida ham tezaurus yaratilishga harakat qilmog‘imiz lozim. Shundagina vatanimiz olimlari va mutaxassislariga jahon andozalariga tezroq moslashish, maqolalarni yozish va tarjima qilish imkoni paydo bo‘ladi. Bunday tezaurusning yaratilishi mamlakatimiz va chet eldagi atamalar o‘rtasida mavjud farqlarni yuzaga chiqarish, o‘zbek tiliga kiritilgan yangi tushunchalar va lingvistik atamalarning ma`nosini chuqur anglash imkonini beradi. Olimlarimizning bunday lug’at tuzishlarida, birinchi navbatda kompyuter lingvistikasi bo‘yicha tezaurusni yaratishga yondashuvlar o‘rganiladi. Tezaurusning umumiy tuzilmasi, tezaurusli manbalar strukturasi va atamalar orasidagi bog‘liqliklar to‘plami izohlanadi. Shu o’rinda atamalar o‘rtasidagi munosabatlarni to’g’ri tanlash va u o’zida aks ettiradigan muammolarning yechimiga, shuningdek, tezaurus terminologik (atamalar) tizimining mantiqiy bir butunligi ta’minlanishiga alohida e’tibor qaratiladi. Bunday tezauruslar asosan ruslarda va inglizlarda ochib berilganini hisobga oladigan bo‘lsak, asosan, ana shu ikki til asosidagi tezauruslarni misol tariqasida olsak bo‘ladi. Kompyuter lingvistikasi bo‘yicha ikki tillik tezaurus tuzilmasini loyihalashtirish mavjud axborot-qidiruv tezauruslari qurilishini qat’iy belgilab beruvchi xalqaro standartlar talablari, shuningdek, INION tomonidan hozirgi kunga qadar to‘plangan tezauruslarni ishlab chiqishdagi tajribalarini tahlil qilish va umumlashtirish asosida amalga oshirilgan. Tezaurusning mukammal variantini yaratishda Rossiya va Хalqaro standartlar asosida tezaurusga kiritilishi mumkin bo‘lgan asosiy birliklarni va ular o‘rtasidagi munosabatlar to‘plamini, leksik birliklar turlarini yig‘ish qoidalarini o‘rnatish, so‘zlarni shakllantirish, so‘z manbalarini tuzish va axborot-qidiruv tezauruslarini rasmiylashtirish ishlari olib boriladi. Axborot-qidiruv tezauruslari, o‘z tarkibiga ko‘ra, barcha birliklari deskriptor (yoki afzalroq (maqbulroq) atama bo‘lgan) va askriptor (maqbul bo‘lmagan) atamalarni aks ettiruvchi tezauruslarga ajratiladi. Bunda deskriptorlar hujjatlarni indekslashda va qidiruv so‘rovnomalarida ishlatilishi, askriptorlar esa (matnga kirish sifatida) bir yoki bir necha deskriptorlar bilan almashtirilishi lozim bo‘ladi. Qancha tilga yo‘naltirilganligiga qarab tezauruslar bir tillik va ko‘p tillik bo‘lishi mumkin. Download 475.5 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling