Shunday qilib, zamonaviy nutqni avtomatik tanish tizimlari bajarishi shart bo’lgan eng muhim talablarga quyidagilarni kiritish mumkin: uzluksiz ravishda nutqni kiritish, diktorga bog’liq bo’lmaslik, ko’p sondagi so’zlarni tanish qobilyati va tizimning yuqori tezligi.
Ishlab chiqilayotgan nutqni avtomatik tanish tizimlarining samaradorligini baholash uchun nutqni qayta ishlashning har bir darajasida bir qator mezonlar qo’llaniladi, ular orasida ikkita asosiy mezon ajralmas hisoblanadi bularga: tanib olishning aniqligi va tizimning reaksiya (javob) vaqti.
2.2. Nutqni tanish tizimlarining klassifikasiyasi
Odatda nutqni tanish tizimining strukturasi hal qilinayotgan muammoning murakkabligidan kelib chiqgan holda tanlanadi. Tizimning strukturasini tanlash muammoni soddalashtirish uchun to’plamlari “shablon” yechimlariga mos kelishi mumkin bo’lgan bir qator belgilar bo’yicha uni oldindan sinflashtirishga imkon beradi.
Belgilar sifatida quyidagilar qo’llaniladi: tizim tomonidan tanib olingan nutq turi; tizimning diktorlarning tanib olingan ovozlariga bog’liqligi; etalonlarning detalizasiya darajasi; tanib olinadigan so’zlar soni [12].
1.1-jadval. Nutqni tanib olish tizimlarini sinflashtirish belgilari.
Belgilar
|
Nutq turi
|
Diktorga bog’liqligi
|
Etalon tarkibiga ko’ra
|
Lug’at hajmi
|
Grammatika turi
|
Tiim sinflari
|
Buyruqlar
|
Bog’liq
|
So’z
|
Kichik
|
Buyruqli
| |
Cheklangan lug’at
|
Bog’liqmas
|
So’z
|
O’rta
|
O’rnatilgan
| |
Uzluksiz nutq
|
Bog’liqmas
|
So’z va gaplar
|
Katta
|
Diktovka
|
1-bosqich. Fonogramma bosqichida nutq signalini yozib olish, nutq signali chegaralarini ajratish, filtrlash, segmentlarga ajratish, oynada signallarga ishlov berish proseduralari bajariladi. Ushbu proseduralarda signallarga raqamli ishlov berishning mavjud standart algoritmlari qo’llaniladi.
2-bosqich. Fonogramma bosqichidan so’ng barqaror, yaxshi ifodalangan va yuqori informativli nutqni xarakterlovi belgilar kartasi sifatida spektrogramma tasvirlari tanlab olindi. Spektrogramma tasvirlarini hosil qilishda odatda FFT (Fast Fourier Transform) spektral almashtirish usuli qo’llaniladi. Ushbu ishda DCT (Discrete Cosine Transform) spektral almashtirish algoritmi qo’llanildi. DCT ning kuchli “energiyani siqish” xususiyati hisobiga undan hosil buladigan spektrogramma tasvirlari sifatli va xalaqitlargi bardoshlidir. Hosil qilingan spektrogramma tasvirlari akustik modellashtirish uchun akustik m’lumotlar sifatida keladi
3-bosqich. Hosil qilingan spektrogramma kiruvchi akustik ma’lumotlar sifatida keladi. Akustik modellashtirishda yashirin markov zanjirlari, dinamik dasturlash algoritmi, svyortkali neyron tarmoq (Convolutional neural network-CNN) va rekurrent tarmoqlar (Recurrent Neural Network-RNN) qo’llaniladi.
4-bosqich. Tanib olish bosqichida akustik modellashtirish natijasida har bir vaqt qadamida yuqori ehtimollik bo’yicha bashorat qilingan fonemlar ketma ketligi hosil qilinadi.
Do'stlaringiz bilan baham: |