Universiteti "tasdiqlayman"
Korpus va kompyuter lingvistikasining farqli jihatlari
Download 5.09 Kb. Pdf ko'rish
|
Ma\'ruza matni. Tilshunoslik. 1-kurs (40soat) kechki
4. Korpus va kompyuter lingvistikasining farqli jihatlari
Kompyuter va korpus lingvistikasi bir-biriga oʻxshash va ba'zi hollarda bir xil degan notoʻgʻri qarashlar uchrab turadi. XX asrning 90-yillari birinchi yarmida korpus tilshunosligi til toʻgʻrisidagi fanning alohida qismi sifatida shakllandi. Shu bilan birga, u kompyuter tilshunosligi bilan yaqindan hamkorlik qiladi, uning yutuqlaridan foydalanadi va, oʻz navbatida, uni boyitadi. Bir guruh olimlar korpus lingvistikasini kompyuter tilshunosligining tarkibiy qismi sifatida baholashadi: korpus tilshunosligi kompyuter texnikasi yordamida tilshunoslik korpusini qurish va ulardan foydalanishning umumiy tamoyillarini ishlab chiqadigan birliklarni yaratiladigan kompyuter tilshunosligi. Shu bilan birga, odatda, kompyuter asbob-uskunalari, dasturlari, tashkilotning kompyuter texnologiyalari va ma'lumotlarini qayta ishlashning keng doirada ishlash mexanizmini modellashtirish tarzida tushuniladi. Kompyuter tilshunosligi korpus tilshunosligi uchun vositalarni (ya'ni dasturlarni) yaratadi. Shu ma'noda ular bir-birini toʻldiradilar. Masalan, korpus tilshunoslari korpusda soʻzlarni avtomatik tarzda belgilash uchun maxsus vositalarga muhtoj. Agar yuz milliondan ortiq foydalanadigan matn birligi mavjud boʻlib, har bir soʻz uchun nutqning bir qismini belgilash kerak boʻlsa, bu jarayonni toʻlaligicha qoʻlda amalga oshirib boʻlmaydi, shu bois tizimli dasturiy ta'minot talab qilinadi. Unga koʻra soʻzlarni tasnifiy belgilariga koʻra belgilash avtomatik ravishda amalga oshiriladi. Kompyuter tilshunosligini qoʻllashning ayrim jihatlari quyidagilar: 1. avtomatik tarjima; 2. autentik va yarim-autentik matnlardan avtomatlashtirilgan ma'lumotlarni olish; 3. inson va mashina oʻrtasida qulay interfeyslarni yaratish; 4. tabiiy tillarda aloqaning kantitatif tavsifi. 223 Shu bilan birga, kompyuter tilshunosligi “odatda, kompyuter vositalari (dasturlari, ma'lumotlarni tashkil qilish va qayta ishlash uchun kompyuter texnologiyalari)ni muayyan sharoitlarda, vaziyatlarda, muammoli sohalarda va tillardagi modellarning koʻlamini nafaqat tilshunoslikda, balki boshqa fanlarga ham qoʻllashni nazarda tutadi”. Korpus tilshunosligi kompyuterni aniq vosita sifatida ishlatadi va ularsiz, albatta, u bajaradigan vazifalarni bajarolmaydi. Korpus tilshunosligi oʻz materiallarini yaratadi, anirogʻi, uni mustaqil ravishda tuzadi. Bu esa, mustaqil tilshunoslikni oʻz ichiga oladi – u ishlatilgan ogʻzaki materiallarning oʻziga xos xususiyati va vositalari, ya'ni korpuslar tahlili uchun dasturlarga egadir. Ilm-fanning mustaqilligi tahlil materiallari yoki tadqiqot usullari mavjudligi bilan belgilanadi. Korpus tilshunosligi unisiga ham, bunisiga ham ega . Korpus lingvistikasiga tilshunoslikning lisoniy korpuslar yaratish va ulardan foydalanishni oʻrganadigan boʻlimi sifatida qaraymiz va bu tanlab olingan matnlar asosida ifodalangan tillarni oʻrganish demakdir. Ba'zi olimlar esa korpus lingvistikasini kompyuter lingvistikasi qamrovidagi soha deya e'tirof etishadi: Korpus lingvistikasi – kompyuter lingvistikasi boʻlimi boʻlib, kompyuter texnologiyalari yordamida til korpuslarini yaratish va qoʻllash muammolari bilan shugʻullanadi. “Kompyuter lingvistikasi – kompyuter texnologiyalardan til faoliyatlarini modellashtirishda ma'lumotlar yigʻish, saralash va keng koʻlamda foydalanishdir. Ba'zi muammoli vaziyatlarga koʻra, tilning kompyuter modeli nafaqat tilshunoslikda, balki u bilan chambarchas bogʻliq boʻlgan fanlarda ham qoʻllash nazarda tutiladi” . A.N.Baranov ta'kidlaganidek, “kompyuter lingvistikasiga tilga asosiy urgʻu berilmasdan, balki eng soʻnggi oʻrinlarda e'tibor qaratilib, bunda tilning kompyuter modellashtiruvi tilshunoslik sohalaridagi programmalashtirishga oid texnik ta'minot nazariyalarigagina ahamiyat beriladi”. Korpus lingvistikasi esa kompyuterlardan vosita sifatida foydalanadi. Tan olish kerakki, agar kompyuterlar boʻlmaganida u hozirdagi faoliyatini amalga oshira olmas edi. Fanlarning taraqqiyoti natijasida korpus lingvistikasi barcha fanlarda tatbiq etiladi, lekin bu orqali ushbu fanlar kompyuter sohasi (computer science)ning bir qismi boʻlib qolmaydi. Zamonaviy tilshunoslikda har ikkala fanning oʻrganilish darajasi va mazkur sohalar boʻyicha dunyo olimlarining izlanishlari va ilmiy qarashlariga tayangan holda kompyuter lingvistikasi korpus lingvistikasidan quyidagi xususiyatlariga koʻra keskin farqlanishi boʻyicha xulosalar chiqarildi: 1. nomlanishidagi farq; 2. mazkur ikki sohaning belgilangan maqsadlari jihatidan: 224 a) kompyuter lingvistikasi tilga oid programmalarni ishlab chiqishni oʻz oldiga asosiy maqsad qilib qoʻyadi. Ta'kidlash joizki, bu bevosita tilshunoslik oldidagi muamolarni hal etishga qaratilmagan; b) korpus lingvistikasi esa, fanning maqsadi sifatida mavjud tilning korpusini yaratish va uning yordamida tildagi soʻzlar, iboralar hamda boshqa lisoniy birliklarning qoʻllanilish chastotasini aniqlashni belgilab qoʻygan. Bu esa korpus lingvistikasini aynan tilshunoslikka oid ekanligini koʻrsatadi. 3) kompyuterning barcha fanlarda foydalanish oʻrni va ahamiyati tomonidan: a) kompyuter lingvistikasida kompyuter qurilmalari asos boʻlib, ushbu fandagi barcha izlanishlar kompyuterlar va ularning afzalliklarini oshirishga qaratiladi; b) korpus lingvistikasi esa kompyuter qurilmalaridan faqatgina vosita sifatida foydalanadi, bunda matnlarni yigʻish va saralash amaliyotlarini bevosita ular yordamida amalga oshiradi. Har qanday yuksalayotgan fan oʻz amaliyotida kompyuterlar taraqqiyotining yutuqlaridan foydalanadi, lekin ushbu fanlar (korpus lingvistikasi, kompyuter lingvistikasi, kompyuter matematikasi, kompyuter fizikasi) kompyutershunoslikning bir qismi sifatida qabul qilinishi joiz emas. Mazkur fanlar tahlil ob'ektini tadqiq etishda kompyuterdan vosita sifatida foydalanadi, xolos. Yuqoridagi tahlillardan kelib chiqib, shuni aytish mumkinki, korpus lingvistikasi kompyuter lingvistikasining alohida bir qismi yoki boʻlimi emas. Ular yoʻnalish hamda tadqiqot ob'ekti, maqsad va muammolari turlicha boʻlgan mustaqil fanlardir. Download 5.09 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling