Amaliy mashg`ulot №2 Mavzu


Download 53.61 Kb.
Sana16.11.2021
Hajmi53.61 Kb.
#175323
Bog'liq
2-Amaliy mashgulot Nutqli signallarning lokal xarakteristikalarina topish(dinami


Amaliy mashg`ulot №2

Mavzu: Nutqli signallarning lokal xarakteristikalarina topish(dinamik, og’iz nuqtalari, energiya, quvvat)

Ishdan maqsad: Nutqli signallarning lokal xarakteristikalarini topishni (dinamik, og’iz nuqtalari, energiya, quvvat) o’rganish.

Nazariy qism.

Birovning gapini tinglaganimizda, ichki qulog'imiz tovushning chastota spektrini tahlil qiladi va miya so'zni idrok etadi. Ba'zi kompyuterlar bu jarayonni spektr analizatori yordamida simulyatsiya qilishi mumkin.



Ovoz signallari analizatorga mikrofon orqali kiradi va ularning spektral xususiyatlari tahlil qilinadi. Keyin kompyuter qabul qilingan signallarni dasturlashtirilgan fonemalar ro'yxati yoki akustik bloklar bilan taqqoslaydi. Qisqa muddatli signallar so'zlarning standart naqshlari bilan taqqoslanadi va til va sintaksis qoidalari bilan taqqoslanadi.

Ushbu jarayon kompyuterga aytilgan so'zlarni aniqlashga yordam beradi. Agar dastur etarlicha murakkab bo'lsa, hatto kontekst bo'yicha "homila" yoki "zaif" so'zi ishlatilganligini aniqlash mumkin. Ammo kompyuter nutqni haqiqatan ham odamlar tushunishi mumkinmi yoki yo'qmi, baribir qizg'in bahs-munozaralarning mavzusi. Siz kompyuterni ba'zi so'z birikmalariga javob bera oladigan tarzda dasturlashingiz mumkin, ammo bu haqiqiy tushunishni o'rnini bosadimi? Sun'iy intellekt sohasidagi ba'zi ekspertlarning fikriga ko'ra, bir necha o'n yillar ichida kompyuter odam bilan haqiqiy norasmiy suhbatni amalga oshirishi mumkin. Shunga qaramay, ko'plab mutaxassislar kompyuter har doim dastur, oldindan tayyorlangan javoblar bilan cheklanib qolishiga ishonishadi.

Bir necha soniyadan ko'proq vaqt davomida qilingan tovushlar qisqa vaqt segmentlariga bo'linadi. Keyin kompyuter har bir segmentning chastota tarkibiy qismlarini tahlil qiladi.

Akustik tahlil

Ovoz spektrografi ko'rinadigan shaklda tovush spektrini anglatadi. Tahlilning bitta usuli bilan inson ovozining normal tovushlar zanjiri segmentlarga bo'linadi, ularning rang kodi ularning tarkibiy qismlarining kuchliligi va chastotasini ko'rsatadi. Yuqoridagi rasmda bo'lgani kabi, uch o'lchovli grafikalarda bunday ma'lumotlarni vizual ravishda namoyish etishning boshqa usuli tasvirlangan.






Amaliy qism


Tanib olish bosqichlari:

  • 1. Nutqni qayta ishlash nutq signalining sifatini baholashdan boshlanadi. Ushbu bosqichda aralashish va buzilish darajasi aniqlanadi.

  • 2. Baholash natijasi tan olish uchun zarur bo'lgan nutq parametrlarini hisoblash modulini boshqaradigan akustik moslashuv moduliga yuboriladi.

  • 3. Signalda nutqni o'z ichiga olgan bo'limlar belgilanadi va nutq parametrlari baholanadi. Fonetik va prosodik probabilistik xususiyatlar sintaktik, semantik va pragmatik tahlil uchun ajralib turadi. (Nutq qismlari, so'z shakli va so'zlar o'rtasidagi statistik munosabatlar to'g'risidagi ma'lumotlarni baholash.)

  • 4. Keyin, nutq parametrlari tan olish tizimining asosiy birligi - dekoderga kiradi. Bu kirish nutqining oqimini akustik va til modellarida saqlanadigan ma'lumotlar bilan taqqoslaydigan va tanib olishning yakuniy natijasi bo'lgan so'zlarning eng ko'p ketma-ketligini aniqlaydigan tarkibiy qism.

Mobil ilovalarda nutqni aniqlash texnologiyasidan foydalanishning muvaffaqiyatli misollari: Yandex Navigator-da ovozni manzilga kiritish, Google Now ovozli qidirish.

Mobil qurilmalardan tashqari, nutqni aniqlash texnologiyasi biznesning turli sohalarida keng qo'llaniladi:


Topshiriqlar

Xar bir topshiriq guruxlar ya’ni 4 ta ketma – ket jurnalda navbati bilan turuvchi talabalar birgalikda bajarishi talab etiladi.

1. Yandex Navigator-da ovozni manzilga kiritish.(1-4)

2. Google Now ovozli qidirish.(5-8)

3. Supersonic Fun Voice Messenger.(9-12)

4. Supersonic Fun Voice Messenger (Mobil qurilmalarda ishlatish).(13-16)

5. Google Now ovozli qidirish (Mobil qurilmalarda ishlatish). (17-20)

6. Yandex Navigator-da ovozni manzilga kiritish. (Mobil qurilmalarda ishlatish) (21-25)

Аdabiyotlar:

Ронжин А. Л., Карпов А. А., Ли И. В. Система автоматического распознавания русской речи SIRIUS. — Спб.: СПИИРАН, 2006. — 12 с. Wikipapedia.org [https://en.wikipedia.org/wiki/CMU_Sphinx] Dong Yu Li Deng. Automatic Speech Recognition. 2016 year.

Internet manbalar:



https://www.apkmirror.com/apk/area-120/supersonic-fun-voice-messenger/
Download 53.61 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling