1. Ish mavzusi: Nutq signallariga dastlabki ishlov berishning dasturiy vositasini ishlab chiqish
Muammoning o‘rganilganlik darajasi
Download 1.17 Mb.
|
2 amaliy mashg\'ulot
Muammoning o‘rganilganlik darajasi. Nutq signaliga dastlabki ishlov berish, qayta ishlash va tanib olish model, usul va algoritmlarini ishlab chiqish va takomillashtirish masalalarini yechish hamda ularni amaliyotga joriy etish bo‘yicha xorijiy olimlardan Mixaylov V.G., Sapojkov M.A., Nazarov M.V., Proxorov Yu.N., Lanne A. A., Grey A. X., Markel Dj.D., Rabiner L. R., Sitnyakovskiy I.V., Shafer R.V., Shalimov I.A., Petrovskiy A.A., Kovalgin Yu.A., Itakura F., Reyder Ch., Makxoul Dj va boshqalarning ilmiy ishlari diqqatga sazovor.
O‘zbekistonda tanib olish va nutq signallarini tahlil qilish nazariy asoslarini rivojlantirishga M.M.Kamilov, Sh.X.Fozilov, E.M.Aliev, R.H.Hamdamov, M.M.Musaev, N.A.Ignatev, S.S.Sodiqov, N.S.Mamatov, N.M.Mirzaev, S.S.Radjabov, Sh.Ye.Tulyaganov va boshqalar o‘zlarining hissalarini qo‘shib kelmoqdalar. Hozirgi kunda nuqt signallariga ishlov berish asosida shaxsni tanib olish tizimlari va nutqni tanib olish texnologiyalari jadal sur’atlar bilan rivojlanmoqda. Ushbu yo‘nalish bo‘yicha o‘tkazilgan tadqiqotlar tahlili shuni ko‘rsatadiki, nutq signallarini tahlil qilish asosida nutqni tanib olish texnologiyalari eng yaxshi, istiqbolli texnologiyalaridan biri hisoblanadi. Biroq, bunday texnologiya asosida shaxsni va nutqni tanib olish avtomatlashtirilgan tizimlarini yaratishda vujudga keladigan muammolar hozirgi kungacha yetarli darajada hal etilmagan. Bundan tashqari, dastlabki ishlov berish asosida shaxsni va nutqni tanib olish ixcham, ishonchli, mustaqil va yuqori tezlikni ta’minlovchi usul va algoritmlarini ishlab chiqish muammosi yetarli darajada o‘rganilmagan. So'nggi paytlarda shovqindan keyin noqulay sharoitlarda nutqni aniqlashga e'tibor kuchaydiб йarshilik haqiqiy hayotda nutqni tanib oluvchilardan amaliy foydalanish uchun asosiy to'siqlardan biriga aylandi. Hozirgacha taklif qilingan usullarni eksklyuziv bo'lmagan to'rtta toifaga bo'lish mumkin: . signalni qabul qilish, . akustik tahlil va parametrlashtirish; . mos yozuvlar modellashtirish, . tanib olish texnikasi. Tahlil va parametrlash darajalarida hozirgacha ishlab chiqilgan texnikalarning aksariyati shovqinga qaratilgan statsionar shovqin mavjudligida pasayish va ular ko'pincha statsionar bo'lmagan shovqin holatlarida muvaffaqiyatsizlikka uchraydi. Bu Shunday qilib, statsionar bo'lmagan shovqin jarayonlari bilan shug'ullanishga qodir mustahkam texnikani ishlab chiqish muhimdir bir qator amaliy sohalarda (harbiy muhit, sanoat va boshqalar) juda keng tarqalgan. Ushbu maqola shovqinli nutqni aniqlash sohasining qisqacha so'rovini taqdim etadi. Biz birinchi navbatda xulosa qilamiz tizimni ishlab chiqishda duch keladigan asosiy qiyinchiliklar va biz nutq signalini akustik qayta ishlash va parametrlashtirish bilan bog'liq uchta asosiy toifadagi echimlarni kiritamiz, statistik modellashtirish va tanib olish texnikasi. MUAMMOLAR VA YECHIMLARNING ko’rib chiqish Shovqinli nutqni tanib olishning qiyinchiliklari shovqinning nutqqa turli ta'siridan kelib chiqadi nutq signaliga atrof-muhit shovqinining qo'shilishi, signalning buzilishi va o'zgarishlar sifatida umumlashtirilishi mumkin. artikulyatsiyada. Ular ikkita asosiy hodisaga olib keladi: o'rganish uchun shart-sharoitlar mavjud bo'lsa, nutqni aniqlash tizimining ishlashining yomonlashishi va sinov uchun. Misol uchun, u kattalik tartibining degradatsiyasi aniqlandi toza nutq bilan o'rgatilgan va shovqinli bilan sinovdan o'tkazilganda ajratilgan so'z tanuvchisi uchun xatolik darajasi signal-shovqin nisbati 18 dB [Z] bo'lgan so'zlar. Bu umumiy ko'rsatkichni oshirishni talab qiladi nutqni tanib olishning mustahkamligi, chunki oddiy yechim bir xil bo'lishidan iborat ta'lim va sinov uchun shart-sharoitlar kamdan-kam hollarda arzon va odatda real emas; shovqinli muhitda talaffuz qilinadigan tovushlarni o'zgartirish (Lombard effekti [I]). Bu ta'sir ko'p jihatdan ma'ruzachiga, kontekstga va shovqin darajasiga bog'liq [3]. Shunday qilib, buni qilish juda qiyin miqdorni aniqlash va modellashtirish. Xulosa qilib aytadigan bo'lsak, mashg'ulotlar va sinov usullari o'rtasidagi nomuvofiqlik hal qilinishi kerak bo'lgan asosiy muammodir nutqni tanib olishning salbiy, real hayotiy sharoitlarida. Garchi bu muammolarni hal qilish uchun hozirgacha juda ko'p usullar taklif qilingan hech biri to'liq qoniqarli emas. Bu usullarning barchasi nutqning asosiy ketma-ketligining beshta asosiy bosqichiga aralashadi tan olish jarayoni: . Nutq signalini qabul qilish: shovqinni bekor qiluvchi mikrofonlar yoki mikrofon massivlaridan foydalanish, adaptiv yoki faol shovqinni bekor qilish texnikasi, . akustik tahlil va parametrlashtirish; . segmentatsiya va nutq-nutqni aniqlash: mustahkam texnikalar a shovqinli nutqni aniqlashdagi xatolar soni, nutq chegaralarini noto'g'ri aniqlashdan kelib chiqadi; . mos yozuvlar namunalarini modellashtirish, . tanib olish algoritmlari va masofa o'lchovlari. Albatta, turli usullar eksklyuziv emas va ularni olish uchun birlashtirilishi mumkin qoniqarli ko'rsatkichlar. 1.3 Bu ish nutq texnologiyalari sohasida o'rganishga bag'ishlangan. Ish Fourier-ning alohida konvertatsiyasi yordamida nutq signallarini oldindan qayta ishlash uchun dasturiy qobiqning tavsifini taqdim etadi. Ushbu dasturiy qobiq turli xil algoritmlarni va nutq signallarida mavjud bo'lgan ma'lumotlarni qayta ishlash usullarini o'rganish uchun vosita yaratish maqsadiga ega. Ushbu ishda, tanib olish tizimi asosida, Fourierning nutq signallarining akustik xususiyatlarini ta'kidlashda vosita sifatida alohida konvertatsiya qilishning qo'llanilishi shartlari o'rganiladi. Kirish inson uchun kompyuter bilan muloqot qilishning tabiiy vositalarini yaratish bugungi kunda zamonaviy ilm-fanning eng muhim vazifasidir, axborotni nutqqa kiritish esa eng qulay tarzda amalga oshiriladi. Nutqni aniqlash-nutq signallarining akustik xususiyatlarining tasvirlarini tasniflash vazifasi. Neyron tarmoqqa asoslangan nutqni aniqlash tizimlarida ikkita asosiy tizim mavjud: nutq signallarining informatsion akustik xususiyatlarini ta'kidlash va akustik tasvirni shakllantirish uchun mo'ljallangan nutq signallarini oldindan davolash quyi tizimi, xarakteristikalar to'plami sifatida signal; neyron tarmoqlar orqali akustik tasvirlarni tasniflash quyi tizimi. Ushbu asar Fourier tez konvertatsiya qilish yordamida nutq signallarini tahlil qilish uchun dasturiy qobiq qo'shimchalarining tavsifini taqdim etadi. Ushbu dasturiy qobiq nutq signallarida mavjud bo'lgan ma'lumotlarni tahlil qilishning turli usullari va algoritmlarini o'rganish uchun vositani shakllantirishga qaratilgan. Nutq signallarini oldindan ishlov berish quyi tizimi nutq signalini oldindan qayta ishlash quyidagi bosqichlarni o'z ichiga oladi: nutq signalini kiritish jarayoni; nutq signalining chegarasini tanlash; raqamli filtrlash; nutq signalini bir-biriga o'xshash ramkalar bilan kesish; oynada signalni qayta ishlash; spektral konvertatsiya qilish; chastota spektrini normallashtirish. Keling, bosqichlarni batafsil ko'rib chiqaylik. Ovoz signalini kiritish jarayoni ovoz kartasi orqali yoki PCM kodlashda WAV formatidagi fayllar orqali Real vaqtda amalga oshiriladi. 8 kHz namuna olish tezligi va 16 bit kvantatsiyasi nutq ma'lumotlarini uzatish, saqlash va qayta ishlash tizimlarida odatiy parametrlardir. Neyron tarmoqni qayta ishlashni bir necha marta takrorlashni osonlashtirish uchun fayllar bilan ishlash ko'zda tutilgan, bu esa o'rganishda ayniqsa muhimdir. Nutq signalining chegarasini faqat nutqni o'z ichiga olgan uchastkalarning kirish signalidan ajratish uchun ajratish uchun nutq signalining quyidagi xususiyatlari qo'llaniladi: nutq signalining qisqa muddatli energiyasi; zichlik nollarining soni (oniy chastota); pauza hisobotlarining qiymatini taqsimlash zichligi. Ovoz signalining qisqa muddatli energiyasi va zichlikdagi nollarning soni bir vaqtning o'zida kirish signalidan nutqni ajratish uchun ishlatiladi. Bundan tashqari, oddiy (Gauss) taqsimotiga asoslangan usul bilan chiqish signalidan pauzani olib tashlash mumkin. Raqamli filtrlash foydali signal bilan birga odatda turli xil shovqinlarni keltirib chiqaradi. Shovqin nutqni aniqlash tizimlarining sifatiga salbiy ta'sir ko'rsatadi, shuning uchun u bilan kurashish kerak. Quyi tizimdagi shovqin darajasini kamaytirish uchun ikkita raqamli filtr ishlatiladi: tarmoqli filtrdan o'tish; oldingi filtr. Ipli filtrni pastki va yuqori chastotalar filtrining kombinatsiyasi sifatida tasavvur qilish mumkin. Bunday filtr barcha chastotalarni, pastki o'tkazuvchanlik chastotasidan past va yuqori o'tkazuvchanlik chastotasidan yuqori darajada ushlab turadi. Oldindan filtrlash mahalliy buzilishlarning keyinchalik tanib olish uchun ishlatiladigan xarakterli belgilarga ta'sirini kamaytirish uchun taqdim etiladi. Nutq signalining spektral moslashuvi uchun uni tortish past chastotali filtrdan o'tkazish kerak. Bir xil uzunlikdagi belgilar vektorlarini olish uchun bir-biriga o'xshash ramkalar bilan nutq signalini kesish uchun nutq signalini teng qismlarga kesib, so'ngra har bir ramka ichida konvertatsiya qilish kerak. Chegaradagi signal ma'lumotlarini yo'qotishning oldini olish uchun qoplama ishlatiladi. Qoplama qanchalik kichik bo'lsa, oxir-oqibat, ushbu saytga xos xususiyatlar vektoriga ega bo'ladi. Bir-biriga bog'lab turish, ba'zan hisoblash resurslarini tejash tufayli yo'qoladi, chunki u ma'lumotlarni qayta ishlash tezligini sezilarli darajada sekinlashtiradi. Odatda 20-30ms vaqt oralig'iga mos keladigan segmentlarning uzunligi tanlanadi. Oynada signalni qayta ishlash oynada signalni qayta ishlash segmentatsiyadan kelib chiqadigan chegara ta'sirini kamaytirish uchun taqdim etiladi. Kiruvchi chegara effektlarini bostirish uchun signalni oyna funktsiyasi bilan ko'paytirish odat tusiga kiradi. 4 turdagi oyna vazifalari mavjud: to'rtburchak oyna; Xanna oynasi; Hemming oynasi; Blackman oynasi. Hamming oynasi funktsiya sifatida ishlatiladi. Amplituda va zarf nutq signalining shakli haqidagi ma'lumotlarning spektral konvertatsiyasi nutqdan leksik elementlarni ta'kidlash uchun etarli emas. Turli holatlarga qarab, zarfli nutq signalining shakli keng chegaralarda farq qilishi mumkin. Tan olish muammosini hal qilish uchun tan olish jarayonining keyingi bosqichlarida ishlatiladigan nutqning asosiy belgilarini ta'kidlash kerak. Asosiy belgilar nutq signalining spektral xususiyatlarini tahlil qilish orqali ajratiladi. Nutq signalining chastota spektrini olish uchun Fourier (bod) ning tezkor konvertatsiyasi qo'llaniladi. BPF amplitudali spektrni va signal fazasi haqidagi ma'lumotni (haqiqiy va xayoliy koeffitsientlarda) olish uchun taqdim etiladi. Signal fazasi haqidagi ma'lumotlar amplituda spektrlari tashlanadi va hisoblab chiqiladi. Bunday holda, ushbu qiymatning logaritmasi tez-tez ishlatiladi. Bu erda-i chastotasining amplitudali spektri-haqiqiy koeffitsient, - xayoliy koeffitsient, N-BPF o'lchami, - spektrning informatsion qismining o'lchami. Ovoz ma'lumotlari xayoliy qismni o'z ichiga olmaganligi sababli, BPF xususiyatiga ko'ra, natija nosimmetrik, ya'ni . Shunday qilib, NS spektrining informatsion qismi N/2 ga teng. Chastota spektrini normalizatsiya qilish neyron tarmoqlardagi barcha hisob-kitoblar suzuvchi nuqta raqamlari orqali amalga oshiriladi. Shuning uchun neyron tarmoqlar tomonidan tasniflangan ob'ekt parametrlarining qiymatlari [0.0, 1.0] oralig'ida cheklangan. Spektrni neyron tarmoq bilan ishlashni amalga oshirish uchun olingan spektr 1.0 ga normallashtiriladi. Buning uchun vektorning har bir komponenti uning maksimal komponentiga bo'linadi. Nutq signallarini oldindan qayta ishlash uchun dasturiy qobiq C # dasturlash tilida amalga oshiriladi. Kirish WAV formatida ovoz faylini oladi. Ekranda signallar, tegishli ishlov berish bosqichlari va konvertatsiya parametrlari ko'rsatiladi. Foydalanuvchi turli xil algoritmlar va ma'lumotlarni qayta ishlash usullari natijalarini olish uchun parametrlarni o'zgartirishi mumkin. Dastur qobig'ining chiqishida bir qator ramkalar kiradi. Har bir ramka nutq signalining amplitudali spektrlarini tavsiflovchi teng o'lchamli raqamlar to'plamiga mos keladi. Shakl bo'yicha. 1 nutq signallarini oldindan davolashni o'rganish uchun dasturiy qobiqdan foydalanishni ko'rsatadi. Shakl. 1 - dastur qobig'ini nutq signaliga qo'llash xulosa amalga oshirilgan ishlar natijasida Fourierning alohida konvertatsiyasi yordamida nutqni aniqlash tizimi uchun nutq signallarini oldindan davolash uchun dasturiy qobiq taklif etiladi. Nutq signallarini oldindan qayta ishlash chiqishi bilan neyron tarmoqqa asoslangan avtomatik nutqni aniqlash tizimini ishlab chiqish rejalashtirilgan. Download 1.17 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling