Applied Speech and Audio Processing: With matlab examples


Download 2.66 Mb.
Pdf ko'rish
bet36/170
Sana18.10.2023
Hajmi2.66 Mb.
#1708320
1   ...   32   33   34   35   36   37   38   39   ...   170
Bog'liq
Applied Speech and Audio Processing With MATLAB Examples ( PDFDrive )

3.1
Speech production
The sound that we know as speech begins with the lungs contracting to expel air, which
carries sound of an approximately Gaussian frequency distribution [2]. This air is forced
up through the bronchial tract past a set of muscle folds at the top of the trachea called
vocal chords, and sets these vibrating. The air then enters the rear of the mouth cavity
where it follows one of two paths to the outside. The first path is over and around the
tongue, past the teeth and out through the mouth. The second route is through the nasal
38


3.1. Speech production
39
Figure 3.1
Sectional diagram of human vocal apparatus, showing major articulators, resonators
and features of the vocal and nasal tracts.
cavity – and this is the only route possible when the velum is closed. Figure 3.1 shows
a diagram of the speech production apparatus (otherwise known as the human head).
The actual sound being produced depends on many criteria including the lung power
and pressure modulation, the constriction at the glottis, the tension in the vocal chords,
the shape of the mouth, and the position of the tongue and teeth. A brief overview follows,
with more detail available in Infobox 3.3: Speech articulation, on page 44.
(a) Lung power mostly affects the volume of the sound, but rapid variation often
distinguishes a boundary between syllables.
(b) If the glottis is closed temporarily during speech, a glottal stop results such as the /t/
in a Yorkshire-accented reading of ‘I went t’ shops’. A plosive sound like the /d/
in ‘dog’, is a short stop followed by an explosive release.
(c) Vocal chord muscle tension causes the chords to vibrate at different rates, forming
the pitch frequencies. Voiceless sounds (e.g. /s/ in ‘six’), where the vocal chords
do not vibrate, have little or no pitch structure.
(d) If the air is diverted through the nose by the velum closing, a nasal sound such as
/m/ in ‘mad’ results. Different timbre also results from the slightly different path
length from lungs to nose compared with lungs to mouth (imagine two different
length organ pipes).


40

Download 2.66 Mb.

Do'stlaringiz bilan baham:
1   ...   32   33   34   35   36   37   38   39   ...   170




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling