I bob. 1 Korpus tushunchasi va korpus lingvistikasi tahlili


Internetdan ingliz korpusi bilan ishlash uchun vositalar


Download 44.96 Kb.
bet2/7
Sana28.12.2022
Hajmi44.96 Kb.
#1018769
1   2   3   4   5   6   7
Bog'liq
Bob 1

Internetdan ingliz korpusi bilan ishlash uchun vositalar:
so'z eskizi - grammatik munosabatlarga ko'ra turkumlangan inglizcha birikmalar
tezaurus - har bir so'z uchun sinonimlar va o'xshash so'zlar
kalit so'zlar - bir so'zli va ko'p so'zli birliklarning terminologiyasi
so'z ro'yxatlari - chastota bo'yicha tuzilgan inglizcha otlar, fe'llar, sifatlar va boshqalar ro'yxatin-gramm - ko'p so'zli birliklarning chastota ro'yxati
muvofiqlik - kontekstdagi misollar
Ushbu veb-korporalar yillar davomida qayta-qayta tekshirildi va qayta ishlandi:

English Web corpus 2020 (enTenTen20) - 38 milliard so'z


English Web corpus 2018 (enTenTen18) - 21,9 milliard so'z
English Web corpus 2015 (enTenTen15) - 13 milliard so'z (mavzu tasnifi)
English Web corpus 2013 (enTenTen13) - 19 milliard so'z
English Web corpus 2012 (enTenTen12) - 11 milliard so'z
English Web corpus 2008 (enTenTen08) - 2,7 milliard so'z3

Korpus lingvistikasi tillarning tabiati, tuzilishi va qoʻllanilishini tavsiflovchi dalil manbai sifatida ogʻzaki va yozma matnlar toʻplamini jamlash va tahlil qilishni oʻz ichiga oladi. Bu ish, odatda, muayyan kontekstlarda lingvistik ob'ektlar yoki jarayonlar sodir bo'lish ehtimoli haqidagi ma'lumotlarni o'z ichiga olgan holda tillarni tavsiflash uchun miqdoriy o'lchovni olib keladi. Korpora hajmi va dizayni jihatidan juda farq qiladi, ammo ularning aksariyati tahlilni qo'llab-quvvatlash uchun maxsus ishlab chiqilgan kompyuter dasturlari bilan elektron shaklda. Hozirgi korpus lingvistikasi tilning barcha darajalarini, jumladan, fonologiya, leksika, grammatika va nutqni o‘rganuvchi, lingvistik tavsiflash uchun empirik asos sifatida matnlardan foydalanishning uzoq an’analaridan kelib chiqdi. Korpora ko'pincha grammatik sinflar va funktsiyalarni ko'rsatish uchun izohlanadi. Grammatik tuzilmalarni tahlil qilish yoki konkordansiya yordamida birikmalarni aniqlash uchun dasturiy ta'minot matn tahlilida inqilob qildi. Korpus lingvistikasi ma'lum bir so'zlarni saqlashga moyil bo'lgan kompaniyaga va til foydalanuvchilari o'zlarini odatda ifodalash usullariga e'tibor qaratgan holda, tillarning turli tarixiy, mintaqaviy va sotsiolingvistik kontekstlarda, janrlarda va registrlarda tizimli ravishda o'zgarishiga yangi yoritib berdi. Tillarning ehtimollik tavsiflari tilshunoslar tomonidan qo'llaniladigan boshqa metodologiyalarni to'ldirishi mumkin va lingvistik tavsifdan tashqari, bir qator sohalarda ishlash uchun ta'sir ko'rsatishi mumkin. Bularga tabiiy tilni qayta ishlash, til ta'limi va kognitiv lingvistika kiradi.4



Download 44.96 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling