Universiteti "tasdiqlayman"
Korpus lingvistikasining ob'ekt va predmeti
Download 5.09 Kb. Pdf ko'rish
|
Ma\'ruza matni. Tilshunoslik. 1-kurs (40soat) kechki
5. Korpus lingvistikasining ob'ekt va predmeti
Korpus lingvistikasi kompyuter texnologiyalari yordamida lingvistik korpus (matnli korpus)ning qurilishi va undan foydalanishning umumiy tamoyillarini ishlab chiqish bilan shugʻullanadi. Lingvistik korpus yoki matnli korpus ostida oʻziga xos til muammolarini hal qilish uchun yaratilgan katta hajmdagi mashinada oʻqiladigan, birlashtirilgan, yorliqlangan, formatlangan filologik jihatdan barkamol til ma'lumotlari toʻplami tushuniladi. Korpus tilshunosligi atamasi birinchi marta 1977 yilda ishlatilgan, bu esa korpus tilshunosligini juda yosh ilmiy yoʻnalish deb atashga imkon beradi. Ammo shu qisqa vaqt ichida korpus tilshunosligi hisoblash tilshunosligining yondashuvlaridan biri sifatida zamonaviy tilshunoslikning etakchi yoʻnalishlaridan 225 biriga aylandi. Rossiyada bu atama ingliz tilining halqaro korpusi asoschilaridan biri Sidney Grinbaumning ma'ruzalari tufayli faqat 1996 yilga kelib ma'lum boʻldi. XX asrning 60 yillarida paydo boʻlgan korpus tilshunosligi, nutq amaliyoti uchun yangi metodologik asosni, tadqiqotning ustuvor yoʻnalishlarini yaratdi. Korpus lingvistikasi metalingvistik vosita sifatida til metodologiyasini qurish, undan foydalanish va nutq naqshlarining lingvistik talqini – kompyuter vositalari yordamida “eski” va “yangi” til muammolarini hal qilishda imkon yaratadi. Jahon tilshunosligida kompyuter va korpus lingvistikasi muammolarini oʻrganish XX asrning 40 yillarida boshlanib, bu sohada dastlabki ilmiy farazlar aytildi. Xususan, oʻtgan asrning 60 yillarida mazkur jarayon jadallashdi, XXI asr boshlarida oʻzida millionlab soʻzlarni aks ettiruvchi yuzlab til korpuslari paydo boʻldi. Korpus tilshunosligi zamonaviy amaliy tilshunoslikning ustuvor yoʻnalishi hisoblanadi. Korpus tilshunosligi zamonaviy kompyuter texnologiyalaridan foydalangan holda lingvistik ma'lumotlar korpuslari (matn korpuslari) qurishning umumiy tamoyillarini belgilaydi, yozma va ogʻzaki matnlarning haqiqiy lingvistik hodisalarini tiplash metodologiyasini, shuningdek, ularni saqlash va tahlil qilish usullarini ishlab chiqadi. Matnli korpuslar bilan ishlash tadqiqotchini sub'ektivligidan ma'lum darajada mavhumlashtirishga va tilni ob'ektiv oʻrganishga imkon beradi. Bugungi kunda korpus tilshunosligi koʻpincha tilshunoslikda kompyuter va elektron korpusdan foydalangan holda “real hayotda” tildan foydalanishni oʻrganishga nisbatan yangi yondashuv sifatida tushuniladi. Korpus tilshunosligi mustaqil intizom pozisiyasini da'vo qilish uchun kamida ikkita xususiyatga ega: 1) ishlatilgan ogʻzaki materialning tabiati; 2) vositalarning oʻziga xos xususiyatlari. Agar tilshunoslikning sintaksis, semantika va sosiolingvistik boʻlimlari til tuzilishini yoki lingvistik foydalanishni tavsiflashga yoki baholashga qaratilgan boʻlsa, korpus tilshunosligi kengroq tushuncha, lingvistik tadqiqotning koʻplab jihatlarida qoʻllanilishi mumkin boʻlgan metodologiya hisoblanadi. Korpus tilshunosligini ba'zida “tilshunoslik tadqiqotlarining turli sohalaridagi usullar toʻplami” deb atashadi. Lingvistik tahlil usuli sifatida korpus tilshunosligi ularni qiyosiy oʻrganish jarayonida umumiy va tillar, dialektlar yoki til variantlari oʻrtasidagi alohida faktlarni aniqlashga qaratilgan qarama-qarshi tadqiqotlar bilan ham bogʻliqdir. Lingvistik tahlilning koʻplab turlari empirik ma'lumotlarning mustahkam va keng bazasida eng yaxshi ishlab chiqilgan. E.Finegan korpus tilshunosligini tuzish va undan foydalanish uchun zarur boʻlgan va tilning tabiiy ishlatilishini 226 oʻrganishga yoʻnaltirilgan faoliyat sifatida belgilaydi. Ushbu ta'rif korpus tilshunosligining ijodiy yoʻnalishini ta'kidlaydi. Korpus tilshunosligining ikki tomonlama tabiati (matn korporasini yaratishda ham, foydalanishda ham diqqat markazida) uning ob'ektining ikki tomonlama tabiati bilan belgilanadi – bir tomondan korpus tilshunosligi va boshqa tomondan, bu korpus tilshunosligining mahsulidir. XIX asr oxiri XX asrning boshlarida korpuslar lingvistik tadqiqotlar oʻtkazish uchun yoki koʻpincha amaliy muammolarni echish uchun (masalan, til birliklarining chastotasini hisoblash uchun) yaratila boshlandi. Korpus tilshunosligi uchun kompyuterlarning ixtiro qilinishi va keng qoʻllanilishi bilan rivojlanishning yangi bosqichi boshlanadi – yaratilgan korpuslar mavjudlaridan nafaqat saqlash formatida, balki hajmlarida ham farq qiladi. Olim V.A.Plungyan oʻz vaqtida toʻgʻri baho berganidek, endi tilni oʻrganish uchun odamga ikkita emas, uchta narsa kerak boʻladi: lugʻat, grammatika va ma'lum tildagi matnlarning korpusi. U lugʻat ham, grammatika ham, umuman olganda, ushbu yashash maydonidan tashqarida foydasizdir, chunki til aslida ishlaydi, deb ta'kidlaydi. Lingvistik korpus – ma'lum prinsiplarga muvofiq, belgilangan (izohlangan), maxsus qidiruv tizimi tomonidan taqdim etilgan matnlar toʻplamining vakili. Korpus tilshunosligi tor ma'noda faqat korpuslarni qanday yaratish va ulardan qanday foydalanish haqidagi ilmdir, ammo bu til ilmining yangi mafkurasi rolini koʻproq talab qiladi. Korpus boʻyicha bildirilgan fikrlar, ilmiy nazariyalar xususida quyidagilarni umumlashtirib, qayd etish mumkin: • korpus – “til tanasi” deb ataladigan matnlar toʻplamining bir turi. Ammo oddiy matnlar toʻplamidan farq qiladi; • korpus – ma'lum bir tarzda tashkil etilgan ogʻzaki birlik; • korpus – ma'lum bir tildan olingan shakldagi lingvistik ma'lumotlar toʻplami tahlili uchun mavjud boʻlgan yozma soʻzlar yoki matnlar; • korpus – istalgan tilda ogʻzaki yozi yozma ravishda yozilgan tabiiy matnlar toʻplami. Demak, korpus – soʻzlar, iboralar, grammatik shakllar va soʻz ma'nolari tizimlari. Bugungi globallashuv davrida har bir xalq, har qaysi mustaqil davlat oʻz milliy manfaatlarini ta'minlash, bu borada, avvalo, oʻz madaniyatini, azaliy qadriyatlarini, ona tilini asrab-avaylash va rivojlantirish masalasiga ustuvor ahamiyat qaratishi tabiiydir. Korpus lingvistikasi rivojlantirilsa, sun'iy intellektning oʻzbek tilini “tushunish, oʻqiy olish, qayta tahrirlash, unga mos javob qaytarish”ini ta'minlaydigan dasturlar yaratiladi (bu tilshunos va dasturchilar hamkorligidagi 227 amalga oshiriladigan dolzarb vazifa). Agar oʻzbek tili korpusi yaratilsa, “Google”da oʻzbek tilida qidiruv tizimi paydo boʻladi. Onlayn tarjima (internet tarjima) yoki avtomatik tarjima dasturlari rivojlantiriladi. Bu orqali esa oʻzbek tilining turli elektron lugʻatlarini yaratish imkoniyati kengayadi, tilni dunyo sahnasiga olib chiqish imkoniyati kengayadi. Download 5.09 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling