Applied Speech and Audio Processing: With matlab examples


Physiological characteristics


Download 2.66 Mb.
Pdf ko'rish
bet141/170
Sana18.10.2023
Hajmi2.66 Mb.
#1708320
1   ...   137   138   139   140   141   142   143   144   ...   170
Bog'liq
Applied Speech and Audio Processing With MATLAB Examples ( PDFDrive )

Physiological characteristics such as the speed of tongue movement, size of mouth
opening, placement of tongue, lip shaping and so on that are the features of a
particular person when speaking.
Behavioural characteristics include the loudness and expressiveness of a person’s
voice. Expressiveness may well include pitch changes, and may be for linguistic
reasons (accent, pronunciation, and so on). Some people speak faster than others,
and would thus have a higher syllabic rate. Other people flatten their vowels,
produce rolling /r/ sounds, guttural /g/ sounds, and so on.
However, in the computational domain, we have simply a one-dimensional signal to
consider: the audio vector. The process for almost any classification task will begin
similarly by performing an analysis upon the input signal to extract features. In Chapter 6
we discussed many such features. It is very likely that some of those features are more
suitable for use in classifying speakers, and there are probably as many different features
to choose from as there are researchers working in this field [13].
Before leaving the discussion on speaker classification, it must be remembered that
there can be significant variation in the recorded voice of a person. We have already
alluded to issues such as microphone response, distance to the mouth of the speaker,
orientation to the speaker, and the presence of background noise. But even assum-
ing perfectly repeatable recording, the voice may change. Some reasons for this might
include:
• Long-term effects due to physiological changes such as growth, or as another example,
due to smoking-induced cell damage to the throat lining.
• Long-term behavioural changes. To take one example, it has been observed by the
author that those living in Japan tend to speak quietly while those living in Hong
Kong tend to speak loudly, from a UK English perspective. Would I learn to speak
more quietly after living in Japan for a few years, or more loudly after living in Hong
Kong for a few years?
• The emotional state of the speaker, including anger, but also stress and even gentle-
ness.
• Illness, such as influenza, sinusitis – inflamed throat, blocked nose, and so on. Inner
ear infections of various forms will alter the feedback path between voice and brain
that is part of the speech production regulatory mechanism, thus affecting speech.
• Time of day – again the author observes that people tend to speak more slowly in the
early morning if they are unused to waking early. Waiting for the ‘brain to warm up’,
as an explanation, may not satisfy our medical colleagues, but at least explains the
effect for us.
• Fatigue or tiredness, whether mental or physical (vocal).


172

Download 2.66 Mb.

Do'stlaringiz bilan baham:
1   ...   137   138   139   140   141   142   143   144   ...   170




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling