Mashina tarjimasi: Reja: Mashina tarjimasi


Qoidalar statistikadan keyin qayta ishlanadi


Download 88.5 Kb.
bet2/3
Sana15.11.2023
Hajmi88.5 Kb.
#1775240
1   2   3
Bog'liq
Mashina tarjimasi

Qoidalar statistikadan keyin qayta ishlanadi: Tarjimalar qoidalarga asoslangan vosita yordamida amalga oshiriladi. Keyin statistika qoidalar dvigatelidan chiqishni sozlash / tuzatish uchun ishlatiladi.

  • Qoidalar asosida boshqariladigan statistika: Qoidalar statistik dvigatelni yaxshiroq boshqarish uchun ma'lumotlarni oldindan qayta ishlash uchun ishlatiladi. Qoidalar, shuningdek, normallashtirish kabi funktsiyalarni bajarish uchun statistik natijalarni qayta ishlash uchun ham qo'llaniladi. Ushbu yondashuv tarjima qilishda ko'proq kuchga, moslashuvchanlikka va boshqaruvga ega. Shuningdek, u tarjimadan oldin (masalan, tarkibni belgilash va tarjima qilinmaydigan atamalarni belgilash) va tarjimadan keyin (masalan, tarjimadan keyingi tuzatishlar va tuzatishlar) tarkibida tarkibni qayta ishlash usullarini keng nazorat qiladi.

    Yaqinda, Neural MT paydo bo'lishi bilan, qoidalarning afzalliklari, statistik va asabiy mashina tarjimalarini birlashtirgan gibrid mashinaviy tarjimaning yangi versiyasi paydo bo'ldi. Ushbu yondashuv qoida bo'yicha boshqariladigan ish oqimida oldingi va keyingi qayta ishlashdan, shuningdek NMT va SMT dan foyda olishga imkon beradi. Salbiy tomon - bu o'ziga xos murakkablik, bu yondashuvni faqat aniq foydalanish holatlariga moslashtiradi. Murakkab foydalanish holatlari uchun ushbu yondashuvning tarafdorlaridan biri Omniscien Technologies hisoblanadi.
    Neyron MT
    Asosiy maqola: Asabli tarjima
    A chuqur o'rganish MT ga asoslangan yondashuv, asab orqali tarjima qilish so'nggi yillarda jadal rivojlanishga erishdi va Google o'zining tarjima xizmatlarini endi avvalgi statistik usullaridan ko'ra ushbu texnologiyadan foydalanayotganligini e'lon qildi.[30] Microsoft jamoasi 2018 yilda WMT-2017da insonlar tengligiga erishdi va bu tarixiy voqea bo'ldi.[31]
    Asosiy muammolar

    Avtomatik tarjima ba'zi tushunarsiz iboralarni keltirib chiqarishi mumkin.

    Kompyuter tarjimasidan xitoycha "沒有 進入" buzilgan Bali, Indoneziya. Buzilgan xitoycha jumla "yozuv mavjud emas" yoki "hali kiritilmagan" kabi ko'rinadi.
    Ajralish
    Asosiy maqolalar: So'z ma'nosini ajratish va Sintaktik disambiguatsiya
    So'zning ma'nosini ajratish, agar so'z bir nechta ma'noga ega bo'lsa, mos keladigan tarjimani topishga tegishli. Muammo birinchi bo'lib 1950-yillarda ko'tarilgan Yehoshua Bar-Xill.[32] Uning ta'kidlashicha, "universal entsiklopediya" bo'lmasdan, mashina hech qachon so'zning ikki ma'nosini ajrata olmaydi.[33] Bugungi kunda ushbu muammoni bartaraf etishga qaratilgan ko'plab yondashuvlar mavjud. Ularni taxminan "sayoz" yondashuvlarga va "chuqur" yondashuvlarga bo'lish mumkin.
    Sayoz yondashuvlar matn haqida hech qanday ma'lumotga ega emas. Ular shunchaki noaniq so'z atrofidagi so'zlarga statistik usullarni qo'llashadi. Chuqur yondashuvlar so'zning har tomonlama bilimini taxmin qiladi. Hozirgacha sayoz yondashuvlar yanada muvaffaqiyatli bo'lgan.[34]
    Klod Piron, Birlashgan Millatlar Tashkilotining uzoq yillik tarjimoni va Jahon Sog'liqni saqlash tashkiloti, kompyuter tarjimasi eng yaxshi tarjimon ishining eng oson qismini avtomatlashtiradi, deb yozgan; qiyinroq va ko'proq vaqt talab qiladigan qism, odatda, hal qilish uchun keng ko'lamli tadqiqotlar o'tkazishni o'z ichiga oladi noaniqliklar ichida manba matni, qaysi grammatik va leksik ning eksigentsiyalari maqsadli til hal qilishni talab qilish:
    Nega tarjimonga bir-ikki soat emas, balki beshta sahifani tarjima qilish uchun butun ish kuni kerak bo'ladi? ..... O'rtacha matnning taxminan 90% bu oddiy shartlarga to'g'ri keladi. Afsuski, qolgan 10% mavjud. Olti [ko'proq] soatlik ishni talab qiladigan qism. Muammolarni hal qilish kerak. Masalan, avstraliyalik shifokor manba matnining muallifi Ikkinchi Jahon urushi paytida "Yapon harbiy lagerida" e'lon qilingan epidemiyani misol qilib keltirdi. U yapon mahbuslar bilan Amerika lagerini yoki amerikalik mahbuslar bilan yapon lagerini gapiradimi? Ingliz tilida ikkita his bor. Shuning uchun Avstraliyaga telefon orqali qo'ng'iroq qilish darajasida tadqiqot o'tkazish kerak.[35]
    Ideal chuqur yondashuv tarjima dasturidan ushbu xilma-xillik uchun zarur bo'lgan barcha tadqiqotlarni o'z-o'zidan amalga oshirishni talab qiladi; ammo buning uchun yuqori daraja talab qilinadi A.I. hali erishilmaganiga qaraganda. Piron aytgan noaniq inglizcha iborani ma'nosini taxmin qiladigan sayoz yondashuv (ehtimol, ma'lum bir korpusda qaysi harbiy asirlar lageri tez-tez tilga olinishi mumkinligi haqida) ko'pincha. "Har bir noaniqlik haqida foydalanuvchidan so'rash" ni o'z ichiga oladigan sayoz yondashuv, Pironning taxminiga ko'ra, professional tarjimon ishining atigi 25 foizini avtomatlashtirishi, 75 foizini esa odam bajarishi qiyin.
    Nostandart nutq
    MT ning asosiy kamchiliklaridan biri uning nostandart tilni standart til bilan bir xil aniqlikda tarjima qila olmasligi. Evristik yoki statistik asoslangan MT turli manbalardan ma'lumotni tilning standart shaklida oladi. Qoidalarga asoslangan tarjima, tabiatan, odatiy bo'lmagan odatiy foydalanishni o'z ichiga olmaydi. Bu mahalliy manbadan yoki og'zaki tilga tarjima qilishda xatoliklarni keltirib chiqaradi. Tasodifiy nutqdan tarjimaning cheklovlari mobil qurilmalarda mashinaviy tarjimadan foydalanish muammolarini keltirib chiqaradi.
    Nomlangan sub'ektlar
    Asosiy maqola: Nomlangan shaxs
    Yilda ma'lumot olish, nomlangan sub'ektlar, tor ma'noda, haqiqiy dunyoda aniq nomga ega odamlar, tashkilotlar, kompaniyalar va joylar kabi aniq yoki mavhum shaxslarni anglatadi: Jorj Vashington, Chikago, Microsoft. Shuningdek, u vaqt, makon va miqdor ifodalarini, masalan, 2011 yil 1-iyul, 500 dollar.
    "Smit Fabrioniksning prezidenti" jumlasida ikkalasi ham Smit va Fabrioniks nomlangan sub'ektlar deb nomlanadi va qo'shimcha ma'lumot yoki ism yoki boshqa ma'lumotlar orqali malakaga ega bo'lishi mumkin; "prezident" unday emas, chunki Smit ilgari Fabrioniksda boshqa lavozimni egallashi mumkin edi, masalan. Vitse-prezident. Muddat qattiq belgilovchi statistik mashina tarjimasida tahlil qilish uchun ushbu foydalanishni belgilaydigan narsa.
    Matnda birinchi navbatda nomlangan shaxslar aniqlanishi kerak; agar yo'q bo'lsa, ular xatolarga oddiy ismlar sifatida tarjima qilinishi mumkin, bu, ehtimol, ta'sir qilmaydi BLEU tarjimaning reytingi, ammo matnning inson uchun qulayligini o'zgartiradi.[36] Ular matnning o'qilishi va xabari uchun ta'sir ko'rsatadigan natijaviy tarjimadan chiqarilishi mumkin.
    Transliteratsiya manba tilidagi nomga eng mos keladigan harflarni maqsad tilida topishni o'z ichiga oladi. Biroq, bu ba'zan tarjima sifatini yomonlashtirishi sifatida keltirilgan.[37] "Janubiy Kaliforniya" uchun birinchi so'z to'g'ridan-to'g'ri tarjima qilinishi kerak, ikkinchi so'z esa transliteratsiya qilinishi kerak. Mashinalar ko'pincha ikkalasini ham transliteratsiya qiladi, chunki ular ularni bitta birlik sifatida ko'rib chiqdilar. Bu kabi so'zlarni mashina tarjimonlari, hattoki transliteratsiya komponentiga ega bo'lganlar ham qayta ishlashlari qiyin.
    "Tarjima qilmang" ro'yxatidan foydalaning, u xuddi shu maqsadga ega - tarjimadan farqli o'laroq transliteratsiya.[38] hali ham nomlangan shaxslarni to'g'ri identifikatsiyalashga tayanadi.



    Download 88.5 Kb.

    Do'stlaringiz bilan baham:
  • 1   2   3




    Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
    ma'muriyatiga murojaat qiling