Nutqni tanish. Nutqni tanib olish bosqichlari. Fanning maqsadi va vazifalari


Nutqni aniqlash tizimlari tasniflanadi


Download 32.81 Kb.
bet2/10
Sana08.01.2022
Hajmi32.81 Kb.
#249231
1   2   3   4   5   6   7   8   9   10
Bog'liq
614-17 Jo'rayev Abduvoxid (Nutqni tanish algoritmlari)

Nutqni aniqlash tizimlari tasniflanadi:

  • lug'at hajmi bo'yicha (cheklangan so'zlar to'plami, katta lug'at);

  • karnayga qarab (karnayga bog'liq va karnayga bog'liq bo'lmagan tizimlar);

  • nutq turi bo'yicha (uzluksiz yoki alohida nutq);

  • tayinlash bo'yicha (diktant tizimlari, buyruq tizimlari);

  • ishlatiladigan algoritm bo'yicha (neyron tarmoqlar, yashirin Markov modellari, dinamik dasturlash);

  • tarkibiy birlik turi bo'yicha (iboralar, so'zlar, fonemalar, difonlar, allofonlar);

  • tarkibiy birliklarni taqsimlash printsipiga ko'ra (naqshni aniqlash, leksik elementlarni ajratib ko'rsatish).

Nutqni avtomatik ravishda tanib olish tizimlari uchun shovqin immuniteti, avvalo, ikkita mexanizm yordamida ta'minlanadi:

  • Akustik signalni tahlil qilish asosida bir nechta parallel ishlash, nutq signalining bir xil elementlarini ajratish usullaridan foydalanish;

  • So'zlarni nutq oqimida segmental (fonematik) va yaxlit idrok etish bilan parallel ravishda mustaqil foydalanish.

"... nutqni idrok etish modelidagi nutq signalini qayta ishlash algoritmlari odam foydalanadigan tushunchalar va munosabatlar tizimidan foydalanishi kerakligi aniq".

Hozirgacha qo'llanilgan usul va algoritmlarni quyidagi katta sinflarga bo'lish mumkin:

Nutqni aniqlash usullarini standart bilan taqqoslash asosida tasniflash.

Dinamik dasturlash - vaqt dinamik algoritmlari (Dynamic Time Warping).

Kontekstga sezgir tasnif. U amalga oshirilgandan so'ng, individual leksik elementlar - fonema va allofonalar - nutq oqimidan ajralib, keyinchalik morfemalarga birlashtiriladi.


  • Bayes diskriminatsiyasiga asoslangan diskriminant tahlil usullari;

  • Yashirin Markov modeli;

  • Neyron tarmoqlari.

Statistik ma'lumotlar asosida nutqni avtomatik ravishda qayta ishlash tizimlarining arxitekturalaridan biri quyidagicha bo'lishi mumkin.

Shovqinni tozalash moduli va foydali signalni ajratish.

Akustik model - nutq segmentining tan olinishini ovoz darajasidagi o'xshashlik nuqtai nazaridan baholashga imkon beradi. Har bir tovush uchun dastlab ushbu tovushning nutqda talaffuzini tavsiflovchi murakkab statistik model quriladi.

Til modeli - so'zlarning eng ehtimol ketma-ketligini aniqlashga imkon beradi. Til modelini yaratish murakkabligi ko'p jihatdan o'ziga xos tilga bog'liq. Shunday qilib, ingliz tili uchun statistik modellardan (N-gramm deb ataladigan) foydalanish kifoya. Rus tiliga mansub bo'lgan juda fleksion tillar uchun (bir xil so'zning ko'plab shakllari mavjud bo'lgan tillar), faqat statistik ma'lumotlar yordamida yaratilgan til modellari endi bunday samara bermaydi - orasidagi statistik munosabatlarni ishonchli baholash uchun juda ko'p ma'lumotlar kerak so'zlar. Shuning uchun rus tilining qoidalari, nutq qismi va so'zning shakli va klassik statistik modeldan foydalanadigan gibrid til modellaridan foydalaniladi.

Dekoder - bu tanib olish tizimining dasturiy komponenti bo'lib, u akustik va til modellaridan tanib olish paytida olingan ma'lumotlarni birlashtiradi va ularning kombinatsiyasi asosida so'zlarning eng mumkin bo'lgan ketma-ketligini aniqlaydi, bu esa nutqni uzluksiz tanib olishning yakuniy natijasidir.


Download 32.81 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling