Python dasturlash tilida imloviy tahrir qilish dasturlari haqida

bet	4/6
Sana	13.04.2023
Hajmi	0.86 Mb.
	#1352390

1 2 3 4 5 6

Bog'liq
xudayberganov-n.u.-python-dasturlash-tilida-imloviy-tahrir-qilish-dasturlari-haqida

Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“KOMPYUTER LINGVISTIKASI:
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2022)
http://compling.navoiy-uni.uz/

360
Matnda aniq imlo tuzatish uchun uni ketma-ket dekodlash vazifasi sifatida
qoʻllash foydalidir.
Tabiiy tilni qayta ishlashda bu koʻpincha noisy channel modeli yordamida
shakllantiriladi.
Notoʻgʻri soʻz w boʻlsin. Keyin biz barcha mumkin boʻlgan toʻgʻri
variantlardan c soʻzini topamiz, berilgan w soʻzini c maksimal toʻgʻirlash
darajasigacha oshiradi:
Bayes teoremasidan foydalanib, biz buni quyidagicha yozishimiz mumkin:

Bayes teoremasi:

1. P(A|B) - shartli ehtimollik: B rost boʻlgan taqdirda A hodisasining sodir
boʻlish ehtimoli. A berilgan B ning ehtimoli deb ham ataladi.
2. P(B|A) - ham shartli ehtimollikdir: A rost boʻlgan taqdirda B hodisaning sodir
boʻlish ehtimoli. Bundan tashqari, uni A ehtimolda aniqlangan B ning
ehtimoli sifatida tushunish mumkin, chunki P(B|A) = L(A|B).
3. P(A) va P(B) hech qanday shartlarsiz mos ravishda A va B ni kuzatish
ehtimoli; ular marjinal ehtimollik yoki oldingi ehtimollik deb nomlanadi.
4. A va B turli hodisalar boʻlishi kerak.

Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“KOMPYUTER LINGVISTIKASI:
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2022)
http://compling.navoiy-uni.uz/

361
P(w) va c soʻz uchun ular bir xil boʻlganda, bunday ehtimollikni yanada
soddalashtirish mumkin:
Yakuniy ifodada biz toʻrtta asosiy komponentni aniqlash mumkin:
1- Selection mechanism (Tanlash mexanizmi) –
argmax
Eng yuqori
ehtimollik bilan toʻgʻirlash.
2- Candidate model (Variantlash modeli):
c
∈
variantlar
c ning barcha
variantlarini koʻrib chiqish shartli kerakligini koʻrsatadi. Ushbu model inson
xatolarini 80% idan koʻprogʻini qamrab imkoniyatiga ega.
3- Error model P(w|c) (Xatolik modeli P(w|c)): c matnni ichida w soʻzining
ehtimolligi. Masalan, P(teh|the) nisbatan yuqori, lekin P(theeexyz|the) juda
past ehtimolikda boʻladi.
4- Language model P(c) (Til modeli P(c)): Kiritilgan c soʻzining ehtimolini
baholaydigan ehtimollik modeli til modeli deb ataladi. Masalan, "the" ning
takrorlanishi inglizcha matnning taxminan 7% ni tashkil qiladi, shuning uchun
bizda P(the) = 0,07 da ifodalanadi.

Download 0.86 Mb.

Do'stlaringiz bilan baham:

1 2 3 4 5 6