«Цифровое представление речевых сигналов»

Download 97,05 Kb.

bet	1/5
Sana	24.12.2022
Hajmi	97,05 Kb.
	#1062677
Turi	Самостоятельная работа

1 2 3 4 5

Bog'liq
М4-21 Абдусалямов Фаррух

Министерство высшего и среднего специального образования Республики Узбекистан
«Ферганский филиал Ташкентского университета информационных технологий имени Мухаммада Аль-Хорезми»
Факультет: «Телекоммуникационные технологи»
Кафедра: «Телекоммуникационный инжиниринг»
Предмет: «Обработка видео и аудио сигналов»
САМОСТОЯТЕЛЬНАЯ РАБОТА

магистранта: Абдусалямова Фарруха

по теме: «Цифровое представление речевых сигналов»

Фергана-2022

Цифровое представление речевого сигнала

Частотный диапазон речи находится в пределах 70-7000 Гц. При оценке уровня громкости звука в качестве эталона звукового давления P₀ выбирается его минимальное значение на частоте 1 кГц, при котором звук становится уже слышимым, т.е. P₀=2×10^-5Н/м². Уровень звукового давления определяется соотношением
,
где P - значение звукового давления. Под динамическим диапазоном понимают разность между максимальным и минимальным уровнями сигналов. Динамический диапазон речи составляет 35-45 Дб.
Цифровая система звукозаписи требует представления аналогового речевого сигнала в цифровом виде. В результате аналого-цифрового преобразования (АЦП) непрерывный сигнал переводится в ряд дискретных отсчетов s_k каждый из которых представляет собой целое число, характеризующее аналоговый сигнал в этой точке с определенной точностью. Точность представления зависит от ширины диапазона получаемых чисел, а следовательно от разрядности АЦП. Процесс разбиения сигнала на отсчеты носит название дискретизации. Число отсчетов в секунду называется частотой дискретизации. Частота дискретизации ν_D согласно теореме Котельникова должна быть, по крайней мере, в два раза выше максимальной частоты преобразуемого аналогового сигнала. Дело в том, что спектр сигнала, преобразованного с помощью АЦП в цифровую форму, имеет периодический характер. (Спектр сигнала - это его отображение, характеризующее интенсивность и распределение частотных составляющих сигнала.)
Сигнал после АЦП имеет кроме низкочастотной части спектра, отображающей аналоговый сигнал, еще и высокочастотные компоненты: низкочастотный спектр сигнала повторяется в виде боковых полос с центрами в точках, кратных частоте дискретизации. (ν_D, 2ν_D, ν_D и т.д.) При уменьшении частоты дискретизации произойдет наложение низкочастотной части спектра и боковой полосы с центром в точке ν_D. Наложение спектров приводит к появлению новых спектральных составляющих в сигнале, а значит, к его искажению. В звукозаписи наложение спектров можно убрать, установив перед АЦП фильтр низких частот, подавляющий все частоты, лежащие выше половины частоты дискретизации. Так как на практике нельзя выполнить фильтр с отвесным спадом частотной характеристики, значение частоты дискретизации выбирается несколько больше, чем удвоенное значение верхней частоты спектра речевого сигнала, например, ν_D=22,05 кГц.
Процесс измерения сигнала с округлением до разряда АЦП носит название квантования. Задаваясь требуемым динамическим диапазоном цифровой системы звукозаписи, необходимое число разрядов квантования можно определить из выражения D=6n+1.8 , где D - динамический диапазон (в Дб), n - число двоичных разрядов. Отсюда получаем, что для записи речи необходимо отводить не менее восьми бит на каждый отсчет.
Определение 1.
Кадр X (длины N) - конечная последовательность отсчетов речевого сигнала s₁,...,s_k,...,s_N.

Определение 2.
Реализация фразы - цифровая запись произнесения фразы в виде последовательности кадров X⁽¹⁾,...,X^(t),...,X^(L), где L - длина реализации, X^(t)=s^(t)₁,...,s^(t)_k,...,s^(t)_N. Длина кадра фиксирована, например, N=256, что при частоте дискретизации ν_D=22,05 кГц соответствует длительности по времени 11,6 мс.

Download 97,05 Kb.

Do'stlaringiz bilan baham:

1 2 3 4 5