Python dasturlash tilida imloviy tahrir qilish dasturlari haqida


Download 0.86 Mb.
Pdf ko'rish
bet4/6
Sana13.04.2023
Hajmi0.86 Mb.
#1352390
1   2   3   4   5   6
Bog'liq
xudayberganov-n.u.-python-dasturlash-tilida-imloviy-tahrir-qilish-dasturlari-haqida

Alisher Navoiy nomidagi Toshkent 
davlat o‘zbek tili va adabiyoti 
universiteti 
“KOMPYUTER LINGVISTIKASI: 
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Xalqaro ilmiy-amaliy konferensiya  
Vol. 1
№. 01 (2022) 
http://compling.navoiy-uni.uz/
 
360 
Matnda aniq imlo tuzatish uchun uni ketma-ket dekodlash vazifasi sifatida 
qoʻllash foydalidir. 
Tabiiy tilni qayta ishlashda bu koʻpincha noisy channel modeli yordamida 
shakllantiriladi. 
Notoʻgʻri soʻz w boʻlsin. Keyin biz barcha mumkin boʻlgan toʻgʻri 
variantlardan c soʻzini topamiz, berilgan w soʻzini c maksimal toʻgʻirlash 
darajasigacha oshiradi: 
Bayes teoremasidan foydalanib, biz buni quyidagicha yozishimiz mumkin: 
 
Bayes teoremasi:
 
1. P(A|B) - shartli ehtimollik: B rost boʻlgan taqdirda A hodisasining sodir 
boʻlish ehtimoli. A berilgan B ning ehtimoli deb ham ataladi. 
2. P(B|A) - ham shartli ehtimollikdir: A rost boʻlgan taqdirda B hodisaning sodir 
boʻlish ehtimoli. Bundan tashqari, uni A ehtimolda aniqlangan B ning 
ehtimoli sifatida tushunish mumkin, chunki P(B|A) = L(A|B)
3. P(A) va P(B) hech qanday shartlarsiz mos ravishda A va B ni kuzatish 
ehtimoli; ular marjinal ehtimollik yoki oldingi ehtimollik deb nomlanadi. 
4. A va B turli hodisalar boʻlishi kerak. 


Alisher Navoiy nomidagi Toshkent 
davlat o‘zbek tili va adabiyoti 
universiteti 
“KOMPYUTER LINGVISTIKASI: 
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Xalqaro ilmiy-amaliy konferensiya  
Vol. 1
№. 01 (2022) 
http://compling.navoiy-uni.uz/
 
361 
P(w) va c soʻz uchun ular bir xil boʻlganda, bunday ehtimollikni yanada 
soddalashtirish mumkin: 
Yakuniy ifodada biz toʻrtta asosiy komponentni aniqlash mumkin: 
1- Selection mechanism (Tanlash mexanizmi)
argmax
Eng yuqori 
ehtimollik bilan toʻgʻirlash. 
2- Candidate model (Variantlash modeli)


variantlar
c ning barcha 
variantlarini koʻrib chiqish shartli kerakligini koʻrsatadi. Ushbu model inson 
xatolarini 80% idan koʻprogʻini qamrab imkoniyatiga ega. 
3- Error model P(w|c) (Xatolik modeli P(w|c)): c matnni ichida w soʻzining 
ehtimolligi. Masalan, P(teh|the) nisbatan yuqori, lekin P(theeexyz|the) juda 
past ehtimolikda boʻladi. 
4- Language model P(c) (Til modeli P(c)): Kiritilgan c soʻzining ehtimolini 
baholaydigan ehtimollik modeli til modeli deb ataladi. Masalan, "the" ning 
takrorlanishi inglizcha matnning taxminan 7% ni tashkil qiladi, shuning uchun 
bizda P(the) = 0,07 da ifodalanadi. 

Download 0.86 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling