Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“KOMPYUTER LINGVISTIKASI:
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2022)
http://compling.navoiy-uni.uz/
361
P(
w) va
c soʻz uchun ular bir xil boʻlganda,
bunday ehtimollikni yanada
soddalashtirish mumkin:
Yakuniy ifodada biz toʻrtta asosiy komponentni aniqlash mumkin:
1-
Selection mechanism (Tanlash mexanizmi) –
argmax
Eng yuqori
ehtimollik bilan toʻgʻirlash.
2-
Candidate model (Variantlash modeli):
c
∈
variantlar
c ning barcha
variantlarini koʻrib chiqish shartli kerakligini koʻrsatadi. Ushbu model inson
xatolarini 80% idan koʻprogʻini qamrab imkoniyatiga ega.
3-
Error model P(w|c) (Xatolik modeli P(w|c)):
c matnni ichida w soʻzining
ehtimolligi. Masalan,
P(teh|the) nisbatan yuqori, lekin
P(theeexyz|the) juda
past ehtimolikda boʻladi.
4-
Language model P(c) (Til modeli P(c)):
Kiritilgan c soʻzining ehtimolini
baholaydigan ehtimollik modeli til modeli deb ataladi. Masalan, "
the" ning
takrorlanishi inglizcha matnning taxminan 7% ni tashkil qiladi, shuning uchun
bizda
P(the) = 0,07 da ifodalanadi.
Do'stlaringiz bilan baham: