Korpus asosida bajariladigan mashq va topshiriqlar tizimi system of exercises and assignments based on the body


Download 31.84 Kb.
bet2/4
Sana19.07.2023
Hajmi31.84 Kb.
#1661005
1   2   3   4
Bog'liq
Korpus tayyor

Lingvistik korpus matndan namunalar, lingvistik razmetka, lingvostatistika, til materiallarini tanlash imkoniyatiga ega (lingvistik, tarixiy va madaniy mezonlar asosida).
Hisoblash tilshunosligi– amaliy tilshunoslik yo‘nalishlaridan biri bo‘lgan holda, u informatikaning lingvistik asoslarini hamda til va tafakkur o‘rtasidagi bog‘liqlikning barcha jihatlarini, kompyuter dasturlari yordamida kompyuter muhitida til va tafakkurni modellashtirishni o‘rganadi va uning qiziqishlari quyidagi sohalarda yotadi:
1) lingvistik bilimlar asosida muloqotni optimallashtirish
2) tabiiy til interfeysi va inson-mashina aloqasi uchun tilni tushunish tipologiyalarini yaratish
3) axborot kompyuter tizimlarini yaratish va modellashtirish [Sosnina E.P.]
IPS (axborot qidirish tizimi) – bular qiziqarli ma'lumotlarni saqlash, qidirish va chiqarish uchun dasturiy ta'minot tizimlari. IPS axborot – matnlar yoki ma'lumotlarni saqlash va olish uchun mo'ljallangan hujjatlar va axborot texnologiyalarining tartiblangan to'plamidir.[ Zaxarov V.P]
Korpusning asosiy mohiyati ham aynan qidiruv tizimidagi muommolarni hal etishga qaratilgan. Endilikda ma’lum bir matnni to‘liq o‘qib chiqish muammosi hal bo‘ldi. Korpusga kiritilgan matndan namunalar orqali o‘zingizga kerakli bo‘limni tanlashingiz va ma’lumotni qisqa muddatda o‘rganishingiz mumkin.
Til korpusining maqsadi – lingvistik birliklarning tabiiy kontekstual muhitda ishlashini ko'rsatish Milliy korpus quyidagi xususiyatlarga ega:

    • til taraqqiyotining u yoki bu davrini aks ettirish uchun yetarli darajada katta hajmdagi matnlarni jamlaydi;

    • tildagi yozma va og‘zaki matnlarning barcha ko‘rinishlarini (badiiy uslubning turli janrlari, ommabop

  • uslub, o‘quv, ilmiy matnlar, rasmiy uslub, so‘zlashuv uslubi, dialektlar va boshq.) imkon darajasida to‘liq

  • qamrab oladi va muvofiqlashtiradi;

  • lingvistik razmetkalarni o‘zida saqlaydi [Ляшевская, 2005: 42].

Korpusda ma’lumotlar to‘plamini yaratishda, matnlarni tanlashda o‘ziga xos usul va yondashuvlari mavjud. Ma’lumotlarni kiritish usullari:

  • Elektron manbalardan olingan ma’lumotlar: bu jarayonda gazetalar, jurnallar, jurnallar, kitoblar va boshqalar matnlari, agar ular elektron shaklda mavjud bo‘lsa, kiritiladi.

      • Veb-saytlardagi ma’lumotlar: Bunga veb-sahifalar, veb-saytlar va uy sahifalaridagi matnlar kiradi. O‘zbek tili axborot matnlari korpusiga axborot saytlaridan matnlar yuklandi.

      • Elektron pochtalardan olingan ma’lumotlar: Ma’lumot manbai sifatida elektron yozuv mashinasi, elektron pochta xabarlari va boshqalar ishlatiladi.

      • Matnni mashinada o‘qish: Belgilarni optik tanib olish (OCR) tizimi yordamida bosilgan matnlarni mashinada o‘qiladigan shaklga o‘tkazadi. Ushbu usul yordamida bosma materiallar tezda korpusga kiritiladi.

      • Ma’lumotlarni qo‘lda kiritish: bu kompyuterga matnlarni terish orqali amalga oshiriladi. Bu qo‘lda yozilgan materiallar, og‘zaki matnlarning nusxalari va eski qo‘lyozmalardan ma’lumotlarni yig‘ish uchun eng yaxshi vosita[Xalqaro ilmiy-amaliy konfrensiya, 2021:300].

O‘zbek tili korpusi uchun uzbekcorpora.uz tizimida tokenayzer, lemmatayzer va razmetkalash dasturlari ishlab chiqilgan:

Download 31.84 Kb.

Do'stlaringiz bilan baham:
1   2   3   4




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling