Omonimiya va lingvistik tizimlarda omonimlarni aniqlash usullari


Download 0.54 Mb.
Pdf ko'rish
bet5/6
Sana13.01.2023
Hajmi0.54 Mb.
#1090922
1   2   3   4   5   6
Bog'liq
omonimiya-va-lingvistik-tizimlarda-omonimlarni-aniqlash-usullari

Qoidalarni qo‘lda 
kiritish usullari 
Qoidalarni 
avtomatik ishlab 
chiqish usullari 
Brill usuli 
Yashirin Markov modeli 
Modellar modefikatsiyasi 
Tayanch vektorlar usuli 
N-gramm modeli
Gibrid usul 


Oriental Renaissance: Innovative, 
educational, natural and social sciences 
 
VOLUME 1 | ISSUE 10 
ISSN 2181-1784 
Scientific Journal Impact Factor SJIF 2021: 5.423 
1020 
w
www.oriens.uz
November 
2021
 
Omonimlikni aniqlashning oddiy statistik metodi va boshqa shu kabi 
metodlarning tavsifini keltirish uchun quyidagi usullar ishlatiladi: 

w

– jumladagi i-o‘rinda joylashgan so‘z, t

– ushbu so‘zning identifikatori 
(tegi). 


(w)
 = {t
1
w
,t
2
w
,…,t
k
w
} w so‘zining barcha mumkin bo‘lgan belgilar majmui. 
Ushbu ma’lumotlarni morfologik lug‘at yordamida olish mumkin. Agar so‘z lug‘atda 
bo‘lmasa uni Brill usulida bajarilganidek, ot so‘z turkumi sifatida hisoblash mumkin, 
ammo lingvistik ta’minot ishonchli bo‘lishi uchun barcha mumkin bo‘lgan teglarni 
qo‘yib chiqish kerak. 

C – korpusdagi muayyan holatlar soni (n-gramm). Bunda C(t) – t teglar soni; 
va C(t
1
,t
2
) – bigrammalar soni (t
1
,t
2
)

C
t
(w,t) – tegli w so‘zlar soni. 

F(w,t)w so‘zida t tegi mavjudligi ehtimoli. Tavsiflar quyidagi formula 
bo‘yicha hisoblanadi: 
– P(t
i
|t
i–1
) - bu t
i-1
tegidan keyin t
i
tegining kelish ehtimollik holati. Bunda i = 1 
bo‘lganda t
i
tegi gapda birinchi teg hisoblanadi. Hisoblash formulasi quyidagicha: 
Yashirin Markov modeliga asoslanib, omonimlikni aniqlashning statistik metodi 
yordamida ishlash natijasida n uzunlikdagi jumlada T
i
 

D(w
i
) bo‘lganda 
T={T
1
,T
2
,...,T
n
teglarning ehtimoliy ketma-ketligi topiladi [7]. 
XULOSA 
Xulosa qilib aytganda, dunyo kompyuter lingvistikasida omonimlikni bartaraf 
etish usullari o‘rganilganida, bu xususdagi tajribadan foydalanib o‘zbekcha 
matnlardagi so‘zshakllarning tegishli tekshirish formulasi yaratildi. Omonimlikni 
bartaraf etish uchun har bir so‘zni “tasniflash” kerak, yaʼni uni lemma – gap bo‘lagi 
va morfologik xususiyatlar majmui bilan taqqoslash mumkin, ular qulaylik uchun bir 
tegga qo‘shiladi. Barcha mumkin bo‘lgan teglarni o‘rganish uchun morfologik 
lug‘atdagi so‘zlarga tegishli havolalarni topish yoki MyStem kabi morfologik 
analizatorni ishlatish yetarli bo‘lib, u so‘z teglarini topishda yordam beradi. Shundan 
so‘ng bir nechta teglar orasidan faqat tegishli tegni tanlash kerak bo‘ladi. 



Download 0.54 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling