Muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti urganch filiali telekommunikatsiya texnologiyalari fakulteti


Download 1.22 Mb.
bet7/11
Sana21.01.2023
Hajmi1.22 Mb.
#1106165
1   2   3   4   5   6   7   8   9   10   11
Bog'liq
kurs ishiAliyeva Dilrabo

Mel-filtr bankini qo’llash:
20-40 (26 ta standart) uchburchak filtrlar toʻplami boʻlib, filtr bankining energiyalarini hisoblash uchun har bir filtr bankini quvvat spektriga ko’paytiriladi va koeffitsientlarni hosil qilinadi. Bu amalga oshirilgandan so’ng, har bir filtr bankida qancha energiya borligi haqida ma‘lumot beruvchi 40 ta son olinadi.

Mel-filtri banklari. Filtrlar soni 26ta.
Mel-filtr bankini quyidagi formula bilan aniqlanadi:

Logarifmlash:
Inson past chastotadagi o‘zgarishlarni yuqori chastotadagi o’zgarishlarga nisbatan aniqroq sezadi. Logarifmlash shunga o’xshash xususiyatga ega. Kirishning x past qiymatida log funksiyasining gradienti yuqori bo’ladi, lekin kirishning yuqori qiymatida gradient qiymati kichikroq bo’ladi. Bu esa inson eshitish tizimiga mos Mel-filtr chiqishiga logarifmlashni qo’llash imkonini beradi.
Diskret kosinus almashtirish:
Ushbu bosqichda oldingi bosqichdagi chiqish uchun teskari o’zgartirish amalga oshiriladi. MFCC usuli diskret kosinus almashtirishni qo’llaganidan
so‘ng signalni 12 koeffitsienti hosil bo‘ladi. Olingan belgilar (har bir freym uchun 12 ta raqam) Mel-chastotali kepstral koeffitsientlar deb ataladi, ya‘ni MFCC usuli nutq signali uchun kirish sifatida olinayotgan audio signalning har bir freymdan 12 ta belgi ajratadi.
2. LPC (Linear Predictive Coding) - bu tovush signallarini kodlash uchun ishlatiladigan algoritm. Bu inson ovozi va boshqa audio signallarni modellashtirishga harakat qiladigan raqamli signalni qayta ishlash algoritmining bir turi. U signalning avvalgi namunalarini tahlil qilish va oldingi namunalar asosida keyingi namunani bashorat qilish orqali ishlaydi. Odatda, LPC tahlilining chiqishi tovushni sintez qilish uchun ishlatilishi mumkin bo'lgan parametrlar to'plamidir.
2.2. Nutq texnologiyalari
Nutq texnologiyasi - bu elektron qurilmaga og'zaki so'z yoki audioni tanib olish, tahlil qilish va tushunish imkonini beradigan hisoblash texnologiyasining bir turi. Bu odatda raqamli tovush signallarini kiritish va uning namunasini xotirasidagi namunalar moslashtirish orqali amalga oshiriladi. Nutq texnologiyasi signalni qayta ishlash va mashinani o'rganish tushunchalariga tayanadi. Signalni qayta ishlash nutqdan so’zlovchi nutqining xususiyatlari, atrof-muhit shovqini va chastotasi kabi tegishli ma'lumotlarni olish uchun ishlatiladi. Nutq aloqaning asosiy shakli bo'lganligi sababli, nutq texnologiyasining rivojlanishi ovozli ma'lumotlardan foydalanish yo'lidagi muhim qadamdir. Nutq texnologiyasining kichik sohalariga quyidagilar kiradi:

  • nutqni aniqlash;

  • nutqni tekshirish;

  • so’zlayotgan vaqtda nutqni matnga aylantirish;

  • interaktiv ovozli javob ( IVR );

  • nutq sintezi;

  • nutq tahlili.

Nutq texnologiyasi ko'pincha ovozli texnologiya bilan almashtiriladi , lekin ular turli funktsiyalarni bajaradi. Nutq texnologiyasi asosiy e'tiborni aytilgan narsaga qaratadi, ovoz texnologiyasi esa uni kim aytganiga e'tibor qaratadi.
Hozirgi kunda sun’iy intellekt qurilmalarining ortib borishi bilan nutq texnologiyasi barcha sohalarda, jumladan, huquq, sog'liqni saqlash, xavfsizlik, moliya, korxona va shaxsiy qurilmalarda ko'p qo’llanilib kelinmoqda. Masalan:

  • Nutq texnologiyalari va so’zlovchini tekshirish platformalari huquqni muhofaza qilish organlarida shaxsning ovozini aniqlashi va tasdiqlash uchun qo’llanilib kelinmoqda;

  • Tibbiy yordam ko'rsatuvchi hodimlar ko'rish qobiliyati zaif yoki eshitish qobiliyati past bo'lgan bemorlarga yordam berish uchun nutq texnologiyasi qurilmalaridan foydalanishlari mumkin.

  • Siri, Google Home va Amazon Alexa kabi ovozli yordamchilari individual nutq texnologiyasi tajribasini taklif qiluvchi qurilmalardir.

  • Turli soha vakillari, jumladan, nutq texnologlari, nutq muhandislari va defektologlar namuna tezligi, signaldagi shovqin nisbati va modulyatsiya kabi texnik audio komponentlarini to'plash uchun nutq texnologiyalaridan foydalanishadi.


Nutq texnologiyasi 2020 yilda COVID-19 pandemiyasining paydo boʻlishi bilan keng qoʻllanila boshlandi. Ko’plab sohalarda masofaviy va gibrid modellarga o‘tishga majbur bo‘lganida, virtual uchrashuvlarni yozib olish va hatto tillarni tarjima qilish uchun nutq texnologiyalardan ko’p foydalanishdi va hozirgi kunda ham keng qo’llanilib kelinmoqda .

Download 1.22 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   11




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling