"kompyuter lingvistikasi: muammolar, yechim, istiqbollar"
Alisher Navoiy nomidagi Toshkent
Download 0.9 Mb. Pdf ko'rish
|
rashidov-h.a.-ozbekcha-matnlardagi-leksik-birliklarni-tartiblovchi-tokenizator-yaratish
- Bu sahifa navigatsiya:
- Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti “KOMPYUTER LINGVISTIKASI: MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti universiteti “KOMPYUTER LINGVISTIKASI: MUAMMOLAR, YECHIM, ISTIQBOLLAR” Xalqaro ilmiy-amaliy konferensiya Vol. 1 №. 01 (2022) http://compling.navoiy-uni.uz/ 275 2-rasm. Matn tilini tanlash Yuqorida ixtiyoriy tilni tanlab olganimizdan so‘ng, endi shu tildagi malumotlarni yuklab olish kerak bo‘ladi. Yuklab olish tugmasini bosib matnni yuklab olamiz. So‘ngra, shu matn ustida taxrir ishlarini amalga oshirish imkoniyati paydo bo‘ladi. Bu imkoniyatlar quyidagicha: 1. Dublikatlarni o‘chirib tashlash(3-rasm). Ya’ni matn tarkibidagi 2 ta bir xil bo‘lgan so‘zlarni o‘chirib tashlanadi. Agar bir xil bo‘lgan so‘zlar so‘zlar 3 ta yoki undan ko‘p bo‘lsa ham 1 tasini qoldirib qolganlarini o‘chirib tashlanadi. 2. Tinish belgilarini o‘chirib chiqish(3-rasm). Ya’ni matnda faqat so‘zlar qolishi uchun tinish belgilar kerak bo‘lmaydi. Shuning uchun ularni o‘chirib chiqish lozim. 3. So‘zlarni alifbo tartibida tartiblash(3-rasm). Tinish belgilari o‘chirib tashlandi, dublikatlar ham yoq, bizda faqat so‘zlarning o‘zi qoldi. Endi ularni alifbo tartibida tartiblab chiqish kerak bo‘ladi va bizning dasturimiz o‘z ishini yakunlaydi. Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti “KOMPYUTER LINGVISTIKASI: MUAMMOLAR, YECHIM, ISTIQBOLLAR” Xalqaro ilmiy-amaliy konferensiya Vol. 1 №. 01 (2022) http://compling.navoiy-uni.uz/ 276 3-rasm. Matn ustida amallar Xulosa. Kompyuter lingvistikasida matnlarni tahrirlovchi, tahlil qiluvchi va tartiblovchi dasturlar, nutqiy sintezator, mashina tarjimasi, matnlarni referatlash, matn korpusi, matnlarni lingvostatistik tahlil qiluvchi kabi yo‘nalishlardagi tadqiqotlar tilshunoslikda katta hajmli lingvistik bazalarning yaratilishiga omil bo‘lib xizmat qiladi. Keyingi paytlarda jahon kompyuter lingvistikasida matnga avtomatik ishlov berishning ilmiy va amaliy natijasi ustida keng ko‘lamli ishlar olib borilmoqda. Jumladan, matnni avtomatik tushunish, mashina tarjimasi, matnni referatlash (gipermatnni asosiy mazmunni o‘zida saqlagan minimatn shakliga keltirish, ya’ni matn hajmini qisqartirish, uni qisqa bayonga aylantirish), tasniflash (mavzu, uslub va janr jihatidan yaqin matnlarni guruhlash), matnni tahrir va tahlil qilish, matnni generatsiyalash (bir nechta tabiiy tilga oid hujjatli matnlardan formula, texnik ishlanmalar, dasturiy tizimlarni yig‘ish), matndan ma’lumotni olish, og‘zaki nutqni aniqlash va sintez qilish kabi dolzarb masalalar kompyuter lingvistikasining mundarijasini egallagan.Hozirgi kunda o‘zbek tilidagi matnlarni tahrir qilish inson mehnati bilan amalga oshirilmoqda. Bu esa o‘z navbatida matnlarni tahrirlashga ko‘p vaqt sarflanishi, iqtisodiy xarajatlarning oshishi, inson |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling