Mavzu: Nutqni tanish tizimlarida tasirchan ranglar


Nutqni tanish tizimlarida tasirchan ranglar


Download 1.34 Mb.
bet2/4
Sana28.10.2021
Hajmi1.34 Mb.
#168977
1   2   3   4
Bog'liq
Nutq tanish ranglar .doc

Nutqni tanish tizimlarida tasirchan ranglar

2-rasm.

Kompyuter nutqini aniqlash ishi haqida oddiy odamga iloji boricha sodda qilib aytib berish va uni matnga aylantirish deyarli imkonsiz vazifadir. Bu haqda hech qanday hikoya murakkab formulalar va matematik atamalarsiz tugallanmagan. Smartfoningiz nutqni qanday tushunishini, mashinalar odam ovozini tanib olishni o'rganganida va ushbu texnologiya qanday kutilmagan sohalarda qo'llanilishini iloji boricha aniq va sodda qilib tushuntirishga harakat qilamiz.Kerakli ogohlantirish: agar siz ishlab chiquvchi yoki matematik bo'lsangiz, postdan deyarli hech qanday yangi narsa o'rganmaysiz va hatto materialning ilmiy xarakteri yo'qligidan shikoyat qilasiz. Bizning maqsadimiz - boshlang'ich o'quvchilarni nutq texnologiyalari bilan eng sodda tarzda tanishtirish va Toshiba o'zining ovozli sun'iy intellektini yaratishni qanday va nima uchun boshlaganligini aytib berish.

Fonemalar - kontekstga qarab, so'zlashuv nutqida so'zning harfini bildiradigan tovush yoki tovushlar to'plami. Masalan, "hozircha" iborasida suhbatdagi "h" harfi ko'pincha "w" ga o'xshaydi. Va "opa bilan" va "birodar bilan" iboralaridagi "s" so'zi birinchi holatda "s", ikkinchisida esa "z" kabi eshitiladi. Ya'ni, harf bitta, ammo fonemalar boshqacha.


Harpining tajribasi shuni ko'rsatdiki, to'liq ovozli bosma so'zlarni yaratish befoyda - bu faqat tanib olish vaqtini oshiradi va aniqligini keskin pasaytiradi, shuning uchun butun dunyo tadqiqotchilari boshqa yo'l - fonemalarni tanib olishdi. 1980-yillarning o'rtalarida IBM Tangora mashinasi har qanday ma'ruzachining nutqini har qanday aksent, lahja va talaffuz bilan tushunishni o'rganishi mumkin edi, buning uchun faqat fonemalar va allofonlar ma'lumotlar bazasi to'plangan 20 daqiqalik mashg'ulot kerak edi. Yashirin Markov modeli IBM Tangoraning so'z boyligini ta'sirchan 20000 so'zga ko'paytirdi - bu Xarpining so'zlaridan 20 baravar ko'p va bu allaqachon o'spirinning so'z boyligi bilan taqqoslanadi.O'tgan asrning 50-yillaridan 1990-yillarning o'rtalariga qadar barcha nutqni aniqlash tizimlari odamning tabiiy so'zlashuv tilini o'qiy olmadi - so'zlar alohida talaffuz qilinishi, ular orasida pauza qilish kerak edi. Haqiqiy inqilobiy voqea 1980-yillarda ishlab chiqilgan yashirin Markov modeli - ulardan kelib chiqadigan ma'lumlarga asoslanib noma'lum elementlar to'g'risida aniq taxminlar qilgan statistik modelni joriy qilish edi. Oddiy qilib aytganda, bitta so'z bilan bir nechta taniqli fonemalar bilan yashirin Markov modeli yo'qolgan fonemalarni juda aniq tanlaydi va shu bilan nutqni aniqlashning aniqligini sezilarli darajada oshiradi.
1996 yilda birinchi tijorat dasturi alohida so'zlarni emas, balki tabiiy nutqning uzluksiz oqimini ajratishga qodir - IBM MedSpeak / Radiology. IBM mahsuloti ixtisoslashgan bo'lib, u tibbiyotda tekshiruv paytida shifokor aytgan natijalarning rentgenogrammalarini yozish uchun ishlatilgan. Bu erda kompyuterlarning kuchi tezda alohida so'zlarni tanib olish uchun etarli bo'ldi. Bundan tashqari, algoritmlar yanada takomillashib bordi, so'zlashadigan so'zlar orasidagi mikropauslarni to'g'ri tanib olish paydo bo'ldi.Birinchi universal tabiiy nutqni aniqlash mexanizmi 1997 yildagi Dragon NaturallySpeaking dasturi edi. U bilan ishlashda ma'ruzachi (ya'ni foydalanuvchi) MedSpeak singari ma'lum bir so'z birikmasi bilan ishlashga yoki o'qishga kirishi shart emas edi - har qanday odam NaturallySpeaking bilan ishlashi mumkin edi, hatto bola ham, dastur hech qanday talaffuz qoidalarini o'rnatmagan.



3-rasm

Shunisi e'tiborga loyiqki, tanib olish dvigatellari 1980-yillarda tayyor edi, ammo kompyuterlarning kuchi etarli emasligi sababli Dragon Systems (hozirgi kunda kompaniya Nuance Communications-ga tegishli) ishlab chiqilishi tabiiy nutqni aniqlash uchun zarur bo'lgan so'zlar orasidagi bo'shliqlarni "tezda" aniqlashga ulgurmadi. Masalan, "u davolanayotgan paytda" bu so'zsiz, kompyuter "nogiron" deb eshitishi mumkin edi.Oldinda nutqni tanib olish tizimlari, neyron tarmoqlari, Google-ning ovozli qidiruvi paydo bo'ldi va nihoyat, Siri ovozli yordamchisi paydo bo'ldi, bu nafaqat nutqni matnga aylantiradi, balki har qanday tabiiy usulda tuzilgan so'rovlarga ham javob beradi.




Download 1.34 Mb.

Do'stlaringiz bilan baham:
1   2   3   4




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling