Omonimiya va lingvistik tizimlarda omonimlarni aniqlash usullari

bet	5/6
Sana	13.01.2023
Hajmi	0.54 Mb.
	#1090922

1 2 3 4 5 6

Bog'liq
omonimiya-va-lingvistik-tizimlarda-omonimlarni-aniqlash-usullari

Gibrid usul Oriental Renaissance: Innovative, educational, natural and social sciences
November 2021

Qoidalarni qo‘lda
kiritish usullari
Qoidalarni
avtomatik ishlab
chiqish usullari
Brill usuli
Yashirin Markov modeli
Modellar modefikatsiyasi
Tayanch vektorlar usuli
N-gramm modeli
Gibrid usul

Oriental Renaissance: Innovative,
educational, natural and social sciences

VOLUME 1 | ISSUE 10
ISSN 2181-1784
Scientific Journal Impact Factor SJIF 2021: 5.423
1020
w
www.oriens.uz
November
2021

Omonimlikni aniqlashning oddiy statistik metodi va boshqa shu kabi
metodlarning tavsifini keltirish uchun quyidagi usullar ishlatiladi:

w
i
– jumladagi i-o‘rinda joylashgan so‘z, t
i
– ushbu so‘zning identifikatori
(tegi).

D
(w)
= {t
1
w
,t
2
w
,…,t
k
w
} w so‘zining barcha mumkin bo‘lgan belgilar majmui.
Ushbu ma’lumotlarni morfologik lug‘at yordamida olish mumkin. Agar so‘z lug‘atda
bo‘lmasa uni Brill usulida bajarilganidek, ot so‘z turkumi sifatida hisoblash mumkin,
ammo lingvistik ta’minot ishonchli bo‘lishi uchun barcha mumkin bo‘lgan teglarni
qo‘yib chiqish kerak.

C – korpusdagi muayyan holatlar soni (n-gramm). Bunda C(t) – t teglar soni;
va C(t
1
,t
2
) – bigrammalar soni (t
1
,t
2
).

C
t
(w,t) – t tegli w so‘zlar soni.

F(w,t) – w so‘zida t tegi mavjudligi ehtimoli. Tavsiflar quyidagi formula
bo‘yicha hisoblanadi:
– P(t
i
|t
i–1
) - bu t
i-1
tegidan keyin t
i
tegining kelish ehtimollik holati. Bunda i = 1
bo‘lganda t
i
tegi gapda birinchi teg hisoblanadi. Hisoblash formulasi quyidagicha:
Yashirin Markov modeliga asoslanib, omonimlikni aniqlashning statistik metodi
yordamida ishlash natijasida n uzunlikdagi jumlada T
i

∈
D(w
i
) bo‘lganda
T={T
1
,T
2
,...,T
n
} teglarning ehtimoliy ketma-ketligi topiladi [7].
XULOSA
Xulosa qilib aytganda, dunyo kompyuter lingvistikasida omonimlikni bartaraf
etish usullari o‘rganilganida, bu xususdagi tajribadan foydalanib o‘zbekcha
matnlardagi so‘zshakllarning tegishli tekshirish formulasi yaratildi. Omonimlikni
bartaraf etish uchun har bir so‘zni “tasniflash” kerak, yaʼni uni lemma – gap bo‘lagi
va morfologik xususiyatlar majmui bilan taqqoslash mumkin, ular qulaylik uchun bir
tegga qo‘shiladi. Barcha mumkin bo‘lgan teglarni o‘rganish uchun morfologik
lug‘atdagi so‘zlarga tegishli havolalarni topish yoki MyStem kabi morfologik
analizatorni ishlatish yetarli bo‘lib, u so‘z teglarini topishda yordam beradi. Shundan
so‘ng bir nechta teglar orasidan faqat tegishli tegni tanlash kerak bo‘ladi.

Download 0.54 Mb.

Do'stlaringiz bilan baham:

1 2 3 4 5 6