Applied Speech and Audio Processing: With matlab examples


Dynamic time warping (DTW)


Download 2.66 Mb.
Pdf ko'rish
bet140/170
Sana18.10.2023
Hajmi2.66 Mb.
#1708320
1   ...   136   137   138   139   140   141   142   143   ...   170
Bog'liq
Applied Speech and Audio Processing With MATLAB Examples ( PDFDrive )

Dynamic time warping (DTW) where strings of features matched from speech under
analysis are shifted in time, compressed and expanded to match to stored templates
of those features from each candidate speaker.
Hidden Markov model (HMM) to match statistical property similarities between a
speaker and candidates.
Long-term statistical methods to consider how the feature tendencies of one speaker
match the candidates’.
Vector quantisation (VQ) methods to compile a simplified feature vector based upon
the measured features from one speaker, and to match this against the stored
codebook from candidates.
Ergodic-HMM based methods to use an approach similar to VQ, but with the statistical
matching properties of the HMM to cater for patterns of temporal variation.
Speech recognition based methods which can, in principle, be used to detect
phonemes, or phoneme classes, either for analysis of their distribution, or
potentially to improve the accuracy of any of the methods already listed.
Even assuming that no background noise is present, the same microphone is used (with
the same distance and orientation to the lips) and the spoken words are identical, the
speech of two people may differ for many reasons including:
Physical characteristics such as length of vocal tract, size of nasal cavity, tooth position
and so on. The effect of vocal tract length is one reason why the voices of children
change, becoming less ‘squeaky’ as they grow older. It is most noticeable during
puberty when a boy’s voice may break. This is caused by his small larynx and


7.3. Speaker classification
171
short, thin vocal chords starting to lengthen and thicken, while simultaneously
facial bones grow to create larger nasal and buccal cavities. The change does
not happen overnight (although it may seem to), but shows how even relatively
gradual changes in physiology can cause much more dramatic changes in speech.

Download 2.66 Mb.

Do'stlaringiz bilan baham:
1   ...   136   137   138   139   140   141   142   143   ...   170




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling