O ptimal variantlar ketma ketligi
To'g'ri tarjima va real nutq uchun ma'ruzachining jinsini aniqlash kerak. Agar jins tasniflagichi taklif darajasida ishlatsangiz, oqim senariysida hech qanday farq bo'lmaydi. Ammo biometrik ma'lumotlar jinsni tasniflash xatosini bir yarim baravar qisqartirishini payqashimiz mumkin: ya'ni biz nafaqat replikatsiyadan odamning jinsini aniqlashimiz, balki avvalgi replikalardagi jins tasnifi natijasini ham hisobga olishimiz mumkin. Buning uchun biz replika kimga tegishli ekanligini tezda aniqlashimiz va shu bilan ma'ruzachining jinsini ko'rsatishimiz kerak.
Optimal variantlar ketma-ketligi
Men yaxshiman!
Agvollaring qanday?
Tarjima qilingan variantlar ketma-ketligi
Mashina tarjimasi nuqtai nazaridan, tayyor videolarni tarjima qilish bilan jonli efirni tarjima qilish o’rtasida solishtirganda hech narsa o'zgarmadi.
Tarjima variantlari ketma-ketligi
Natija audio
Videodagi ma'ruzachi juda tez gapirishi mumkin yoki jumlaning tarjimasi asl nusxadan ikki baravar uzun bo'lishi mumkin. Bunday holda, vaqtni kuzatib borish uchun sintez qilingan audioni siqish kerak bo'ladi. Bu ikki yo'l bilan amalga oshirilishi mumkin: tovush to'lqini darajasida, masalan, PSOLA (Pitch Synchronous Overlap and Add) yordamida yoki neyron tarmoq ichida. Ikkinchi usul bilan nutq tabiiyroq eshitiladi, ammo bu noma’lum parametrlarni tahrirlash qobiliyatini talab qiladi.
Sintezlangan iboralarning davomiyligini kerakli uzunlikka yetkazishgina emas, balki ularni o'z vaqtida kerakli nuqtalarga ajratish ham muhimdir. Ideal holatda, bu har doim ham kuzatilmaydi, bunda yozishni tezlashtirish yoki vaqtni o'zgartirish kerak bo'ladi. Buning uchun stacking algoritmi javob beradi . Oqimlarni tarjima qilishda ortga qaytish yoki takroran eshitish imkoni yo’q, shuning uchun iborani asl videoda talaffuz qilinganidan ikki baravar tez aytish kerak bo'ladigan vaziyatga duch kelish mumkin. Ma'lumot uchun: 30% dan ortiq tezlashuv inson idrokiga sezilarli ta'sir qiladi.
Do'stlaringiz bilan baham: |