Universiteti "tasdiqlayman"


 Korpus lingvistikasining ob'ekt va predmeti


Download 5.09 Kb.
Pdf ko'rish
bet156/175
Sana02.06.2024
Hajmi5.09 Kb.
#1837896
1   ...   152   153   154   155   156   157   158   159   ...   175
Bog'liq
Ma\'ruza matni. Tilshunoslik. 1-kurs (40soat) kechki

5. Korpus lingvistikasining ob'ekt va predmeti 
Korpus lingvistikasi kompyuter texnologiyalari yordamida lingvistik korpus 
(matnli korpus)ning qurilishi va undan foydalanishning umumiy tamoyillarini 
ishlab chiqish bilan shugʻullanadi. 
Lingvistik korpus yoki matnli korpus 
ostida oʻziga xos til muammolarini hal 
qilish uchun yaratilgan katta hajmdagi 
mashinada oʻqiladigan, birlashtirilgan, 
yorliqlangan, 
formatlangan 
filologik 
jihatdan 
barkamol 
til 
ma'lumotlari 
toʻplami tushuniladi.
Korpus tilshunosligi atamasi birinchi marta 1977 yilda ishlatilgan, bu esa 
korpus tilshunosligini juda yosh ilmiy yoʻnalish deb atashga imkon beradi. Ammo 
shu qisqa vaqt ichida korpus tilshunosligi hisoblash tilshunosligining 
yondashuvlaridan biri sifatida zamonaviy tilshunoslikning etakchi yoʻnalishlaridan 


225 
biriga aylandi. Rossiyada bu atama ingliz tilining halqaro korpusi asoschilaridan 
biri Sidney Grinbaumning ma'ruzalari tufayli faqat 1996 yilga kelib ma'lum boʻldi.
XX asrning 60 yillarida paydo boʻlgan korpus tilshunosligi, nutq amaliyoti 
uchun yangi metodologik asosni, tadqiqotning ustuvor yoʻnalishlarini yaratdi. 
Korpus lingvistikasi metalingvistik vosita sifatida til metodologiyasini qurish, 
undan foydalanish va nutq naqshlarining lingvistik talqini – kompyuter vositalari 
yordamida “eski” va “yangi” til muammolarini hal qilishda imkon yaratadi.
Jahon tilshunosligida kompyuter va korpus lingvistikasi muammolarini 
oʻrganish XX asrning 40 yillarida boshlanib, bu sohada dastlabki ilmiy farazlar 
aytildi. Xususan, oʻtgan asrning 60 yillarida mazkur jarayon jadallashdi, XXI asr 
boshlarida oʻzida millionlab soʻzlarni aks ettiruvchi yuzlab til korpuslari paydo 
boʻldi. Korpus tilshunosligi zamonaviy amaliy tilshunoslikning ustuvor yoʻnalishi 
hisoblanadi.
Korpus tilshunosligi zamonaviy kompyuter texnologiyalaridan foydalangan 
holda lingvistik ma'lumotlar korpuslari (matn korpuslari) qurishning umumiy 
tamoyillarini belgilaydi, yozma va ogʻzaki matnlarning haqiqiy lingvistik 
hodisalarini tiplash metodologiyasini, shuningdek, ularni saqlash va tahlil qilish 
usullarini ishlab chiqadi. Matnli korpuslar bilan ishlash tadqiqotchini 
sub'ektivligidan ma'lum darajada mavhumlashtirishga va tilni ob'ektiv oʻrganishga 
imkon beradi.
Bugungi kunda korpus tilshunosligi koʻpincha tilshunoslikda kompyuter va 
elektron korpusdan foydalangan holda “real hayotda” tildan foydalanishni 
oʻrganishga nisbatan yangi yondashuv sifatida tushuniladi. Korpus tilshunosligi 
mustaqil intizom pozisiyasini da'vo qilish uchun kamida ikkita xususiyatga ega:
1) ishlatilgan ogʻzaki materialning tabiati;
2) vositalarning oʻziga xos xususiyatlari.
Agar tilshunoslikning sintaksis, semantika va sosiolingvistik boʻlimlari til 
tuzilishini yoki lingvistik foydalanishni tavsiflashga yoki baholashga qaratilgan 
boʻlsa, korpus tilshunosligi kengroq tushuncha, lingvistik tadqiqotning koʻplab 
jihatlarida qoʻllanilishi mumkin boʻlgan metodologiya hisoblanadi. Korpus 
tilshunosligini ba'zida “tilshunoslik tadqiqotlarining turli sohalaridagi usullar 
toʻplami” deb atashadi.
Lingvistik tahlil usuli sifatida korpus tilshunosligi ularni qiyosiy oʻrganish 
jarayonida umumiy va tillar, dialektlar yoki til variantlari oʻrtasidagi alohida 
faktlarni aniqlashga qaratilgan qarama-qarshi tadqiqotlar bilan ham bogʻliqdir.
Lingvistik tahlilning koʻplab turlari empirik ma'lumotlarning mustahkam va 
keng bazasida eng yaxshi ishlab chiqilgan. E.Finegan korpus tilshunosligini tuzish 
va undan foydalanish uchun zarur boʻlgan va tilning tabiiy ishlatilishini 


226 
oʻrganishga yoʻnaltirilgan faoliyat sifatida belgilaydi. Ushbu ta'rif korpus 
tilshunosligining ijodiy yoʻnalishini ta'kidlaydi.
Korpus tilshunosligining ikki tomonlama tabiati (matn korporasini 
yaratishda ham, foydalanishda ham diqqat markazida) uning ob'ektining ikki 
tomonlama tabiati bilan belgilanadi – bir tomondan korpus tilshunosligi va boshqa 
tomondan, bu korpus tilshunosligining mahsulidir.
XIX asr oxiri XX asrning boshlarida korpuslar lingvistik tadqiqotlar 
oʻtkazish uchun yoki koʻpincha amaliy muammolarni echish uchun (masalan, til 
birliklarining chastotasini hisoblash uchun) yaratila boshlandi. Korpus tilshunosligi 
uchun kompyuterlarning ixtiro qilinishi va keng qoʻllanilishi bilan rivojlanishning 
yangi bosqichi boshlanadi – yaratilgan korpuslar mavjudlaridan nafaqat saqlash 
formatida, balki hajmlarida ham farq qiladi.
Olim V.A.Plungyan oʻz vaqtida toʻgʻri baho berganidek, endi tilni oʻrganish 
uchun odamga ikkita emas, uchta narsa kerak boʻladi: lugʻat, grammatika va 
ma'lum tildagi matnlarning korpusi. U lugʻat ham, grammatika ham, umuman 
olganda, ushbu yashash maydonidan tashqarida foydasizdir, chunki til aslida 
ishlaydi, deb ta'kidlaydi.
Lingvistik korpus – ma'lum prinsiplarga muvofiq, belgilangan (izohlangan), 
maxsus qidiruv tizimi tomonidan taqdim etilgan matnlar toʻplamining vakili.
Korpus tilshunosligi tor ma'noda faqat korpuslarni qanday yaratish va 
ulardan qanday foydalanish haqidagi ilmdir, ammo bu til ilmining yangi mafkurasi 
rolini koʻproq talab qiladi.
Korpus boʻyicha bildirilgan fikrlar, ilmiy nazariyalar xususida quyidagilarni 
umumlashtirib, qayd etish mumkin:
• korpus – “til tanasi” deb ataladigan matnlar toʻplamining bir turi. Ammo 
oddiy matnlar toʻplamidan farq qiladi; • korpus – ma'lum bir tarzda tashkil etilgan 
ogʻzaki birlik;
• korpus – ma'lum bir tildan olingan shakldagi lingvistik ma'lumotlar 
toʻplami tahlili uchun mavjud boʻlgan yozma soʻzlar yoki matnlar;
• korpus – istalgan tilda ogʻzaki yozi yozma ravishda yozilgan tabiiy matnlar 
toʻplami.
Demak, korpus – soʻzlar, iboralar, grammatik shakllar va soʻz ma'nolari 
tizimlari. Bugungi globallashuv davrida har bir xalq, har qaysi mustaqil davlat oʻz 
milliy manfaatlarini ta'minlash, bu borada, avvalo, oʻz madaniyatini, azaliy 
qadriyatlarini, ona tilini asrab-avaylash va rivojlantirish masalasiga ustuvor 
ahamiyat qaratishi tabiiydir.
Korpus lingvistikasi rivojlantirilsa, sun'iy intellektning oʻzbek tilini 
“tushunish, oʻqiy olish, qayta tahrirlash, unga mos javob qaytarish”ini 
ta'minlaydigan dasturlar yaratiladi (bu tilshunos va dasturchilar hamkorligidagi 


227 
amalga oshiriladigan dolzarb vazifa). Agar oʻzbek tili korpusi yaratilsa, 
“Google”da oʻzbek tilida qidiruv tizimi paydo boʻladi. Onlayn tarjima (internet 
tarjima) yoki avtomatik tarjima dasturlari rivojlantiriladi. Bu orqali esa oʻzbek 
tilining turli elektron lugʻatlarini yaratish imkoniyati kengayadi, tilni dunyo 
sahnasiga olib chiqish imkoniyati kengayadi. 

Download 5.09 Kb.

Do'stlaringiz bilan baham:
1   ...   152   153   154   155   156   157   158   159   ...   175




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling