Kommunikatsiyalarini rivojlantirish vazirligi muhammad al xorazmiy nomidagi toshkent axborot texnologiylari universiteti


Download 390.1 Kb.
bet2/2
Sana04.12.2020
Hajmi390.1 Kb.
#159272
1   2
Bog'liq
Askarov Abror 211 -17 SIRB Mustaqil ish


WavePad Sound Edito

Dastur professional bo'lmagan foydalanishga qaratilgan va ixcham ovoz muharriri. WavePad Sound Editor sizga tanlangan yozuv qismlarini olib tashlash yoki treklarni birlashtirish imkonini beradi. O'rnatilgan filtrlar tufayli ovozni kuchaytirish yoki normalizatsiya qilish mumkin. Bundan tashqari, effektlarni qo'llash orqali Rivers oldindan yozib olish uchun ishlatilishi mumkin.



Boshqa imkoniyatlar orasida replay tempini o'zgartirish, ekvalayzer, kompressor va boshqa funktsiyalar bilan ishlash kiradi. Ovoz bilan ishlash vositalari uni optimallashtirishga yordam beradi, bu esa ovozsizlanish, tonallik va tovushni o'zgartirishni o'z ichiga oladi.



Zamonaviy nutq signallariga ishlov beruvchi dasturiy majmualar tahlili

Dunyoning   yetuk brendlari Microsorf, Apple, Google, Yandeks, Ericsson, Motorola, Siemens, Philips, Samsung, Nokia kabi firmalar XX asrning ikkinchi yarmidan buyon ilmiy tadqiqot ishlarini nutq signallariga ishlov berish ustida davom ettirib kelmoqda. Buning natijasi hozirgi kunga qadar  bir qancha zamonaviy inson nutqini qayta ishlash tizimlari yuzaga kelgan. Misol sifatida ularga Natural Dialogue System,   Dragon Dictate Natural Speaking,  L&H Speech Products, Dragon Naturally Speaking 7.0 Preferred  kompleksi, Intelligent Voice Recognition System (IVOS),  Dictation 2004 v.4.5, Aculab, Babear SDK Version 3.0., Nuance, Gornich 5.0 Dick Light    kabi bir qancha apparat va dasturiy vositalarni keltirish mumkin[26]. Ularning tahliliy ko‘rsatgichlari  quyida  keltirilgan.



Voice Navigator ("Nutq texnologiyalari markazi" (MRM) kompaniyasi). VoiceNavigator ovozli uzatish tizimini (OUT) qurishga mo‘ljallangan aloqa markazlari uchun ishlab chiqilgan, nutqni sintez qilish va aniqlash texnologiyasidan foydalangan holda qo‘ng‘iroqlarni avtomatik tarzda amalga oshirish imkonini beradi.

Mahsulot xususiyatlari:

- diktorga bog‘liq bo‘lmagan tizim;

- telefon shovqinlariga va interferensiyaga qarshilik imkoniyati;

- rus tilida so‘zlashuvning 100% ishonchliligi.

Speereo Speech Recognition (SSR). (Rossiya IT-kompaniyasi Speereo Software). Mobil qurilma sanoatida va shaxsiy kompyuter uchun ilovalarni nutq ko‘rinishida ifodalash imkonini beradi. Nutqni aniqlash jarayoni malumotlar serverda emas, to‘g‘ridan-to‘g‘ri qurilma yordamida amalga oshiriladi. Bu  o‘z navbatida ishlab chiquvchilar uchun asosiy afzallik hisoblanadi.

Mahsulot xususiyatlari:

- rus tilida so‘zlashuvlarni 95% ishonchlilik bilan eʼtirof etish;

- diktorga bog‘liq bo‘lmagan tizim;

- 150 ming  so‘z malumotlar bazasi;

- bir nechta tillarni bir vaqtda qo‘llab-quvvatlash.



Ovozni qayta ishlash usullari

Zamonaviy musiqa sanoati doimo rivojlanib, takomillashmoqda. Ovoz yozish uskunalari sifatini yaxshilash bilan tovush sifatiga bo'lgan talablar doimiy ravishda oshib bormoqda. Shuning uchun bugungi kunda ovozni qayta ishlash texnologiyalari jadal rivojlanmoqda. Ovozni qayta ishlash-elektron kompozitorlar va zamonaviy musiqa ijodkorlarining ishida eng muhim operatsiyalardan biri. Ushbu maqola qayta ishlashning barcha usullarini qamrab olmaydi, chunki ularning ba'zilari juda murakkab va vaqt sarflaydi. Biroq, asosiy, eng ko'p ishlatiladigan, bu erda.



O'rnatish

Ovoz bilan ishlashning eng qadimiy usullaridan biri ba'zi joylarni yozib olish, boshqalarni kiritish, ularni almashtirish, ko'paytirish va h.k. bundan tashqari, tahrir qilish ham deyiladi. Barcha zamonaviy audio va video yozuvlar bir daraja yoki boshqa darajada o'rnatiladi.



Amplitudali o'zgarishlar

Signalning amplitudasi ustida turli harakatlar orqali amalga oshiriladi, natijada, namunalarning qiymatlarini doimiy daromad (daromad/gevşeme) yoki vaqt ichida o'zgarib turadigan funktsiya-modulator - amplitudali modulyatsiya bilan ko'paytirishga kamayadi. Amplitudali modulyatsiyaning alohida hodisasi-vaqt o'tishi bilan statsionar ovozni rivojlantirish uchun zarf shakllanishi. Amplitudali o'zgarishlar ketma-ket, alohida namunalar bilan amalga oshiriladi, shuning uchun ular amalga oshirish oson va katta hajmdagi hisob-kitoblarni talab qilmaydi.



Chastotali (spektral) o'zgarishlar

Ovozning chastotali tarkibiy qismlari ustida bajariladi. Agar spektral dekompozitsiyadan foydalansangiz (chastotalar gorizontal ravishda hisoblangan va vertikal ravishda - bu chastotalarning tarkibiy qismlarining intensivligi), unda ko'plab chastota o'zgarishlari spektr ustidagi amplitudali transformatsiyalarga o'xshaydi. Misol uchun, filtrlash - chastotalarni mustahkamlash yoki zaiflashtirish - spektrga tegishli amplitudali konversiyani qo'llash uchun kamayadi. Shu bilan birga, chastota modulyatsiyasi (frequency modulation - FM) shu tarzda tasavvur qilinmaydi - bu ma'lum bir qonun bilan o'z vaqtida butun spektrning yoki uning alohida bo'limlarining o'zgarishiga o'xshaydi. Chastota o'zgarishlarini amalga oshirish uchun Fourier usuli bo'yicha spektral dekompozitsiya odatda qo'llaniladi, bu esa sezilarli hisoblash resurslarini talab qiladi. Shu bilan birga, tamsayı arifmetikasida ishlab chiqarilgan va hatto shaxsiy kompyuterlarda (486-x ning kichik modellaridan boshlab) o'rtacha sifatli signal spektrini Real vaqtda ochishga imkon beruvchi Fourier (BPF, FFT) tez konvertatsiya qilish algoritmi mavjud. Chastotani o'zgartirish uchun, bundan tashqari, ishlov berish va keyinchalik spektrning pıhtılaşması talab qilinadi, shuning uchun filtrlash umumiy maqsadli protsessorlarda amalga oshirilmaguncha Real vaqtda amalga oshiriladi. Buning o'rniga, ushbu operatsiyalarni Real vaqtda va bir nechta kanallar orqali amalga oshiradigan ko'plab raqamli signal protsessorlari (Digital Signal Processor - DSP) mavjud. Bunday protsessorlar zamonaviy professional va yarim professional studiya uskunalari, shuningdek, o'rta va yuqori sinf audio uskunalari (HI-FI) da keng qo'llaniladi. Ovoz effekti (surround) va elektron ekvalayzerlar (Disco, Pop, Rock kabi) - bularning barchasi DSP-da ishlaydi.



XULOSA

Speech to Text (STT) deb nomlanadigan nashrida nutqni aniqlash, shuningdek, og'zaki so'zlarni matnga tarjima qilish uchun uzoq vaqt ishlatilgan. ViaVoice uning qutisiga aytganday, "Siz gaplashasiz, u turlari". Ammo biz bilamizki, STT bilan bog'liq bir muammo mavjud. 10 yildan ortiq vaqtdan beri ViaVoice ni sinab ko'rdim va bu mening kompyuterimda bir hafta davom etmadi. Nima uchun? Bu juda noto'g'ri edi va men ko'proq vaqt va energiyani gapirish va tuzatish uchun hamma narsani yozishdan ko'ra sarfladim. ViaVoice - sanoatda eng yaxshisidir, shuning uchun qolganlarni tasavvur qiling. Texnologiya rivojlangan va takomillashtirildi, lekin matnga murojaat qilish odamlarning savollariga javob bermoqda. Uning asosiy qiyinchiliklaridan biri - so'zlardagi odamlar orasida juda katta farq.

Har bir tilda nutqni tan olish kerak emas, va shunga o'xshashlar odatda ingliz tilida ham qo'llab-quvvatlanmaydi. Natijada, nutqni aniqlash dasturini ishlatadigan qurilmalarning aksariyati faqat ingliz tilida ishlaydi.

Bir qator apparat talablari ma'lum hollarda nutqni aniqlashni qiyinlashtiradi. Fon shovqinini filtri qilish uchun yetarli aqlga ega bo'lgan mikrofonga ega bo'lishingiz kerak, lekin ayni paytda ovozni tabiiy ravishda qo'lga kiritish uchun etarlicha kuchli.

Orqa fonning shovqini haqida gapirish, bu butun tizimning ishdan chiqishiga olib kelishi mumkin. Natijada, ko'p holatlarda, foydalanuvchining nazorati ostida bo'lgan shov-shuvlar tufayli nutq tan olinishi amalga oshirilmaydi.

Nutqni aniqlash, VoIP kabi yangi telefonlar va aloqa texnologiyalari uchun kirish usuli sifatida ommaviy matn kiritish uchun hosildorlik vositasidan ko'ra yaxshiroq bo'lishni isbotlaydi.



Foydalanilgan adabiyotlar:

  1. Лайонс, Р. Цифровая обработка сигналов / Р. Лайонс. – М.: ООО «Бином-Пресс», 2015. – 656 с.

  2. Айфичер, Э. Цифровая обработка сигналов: практический подход / Э. Айфичер, Б. Джервис. – М.: Изд. дом «Вильямс», 2004. – 992 с.

  3. Солонина, А.И. Основы цифровой обработки сигналов: Курс лекций /А. И. Солонина, Д. А. Улахович, С. М. Арбузов, Е. Б. Соловьева, И. И. Гук. – СПб.: БХВ – Петербург, 2012. – 768 с.

Download 390.1 Kb.

Do'stlaringiz bilan baham:
1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling