Rukn: Sharh va fikr-mulohazalar


Download 296.5 Kb.
bet2/2
Sana30.04.2020
Hajmi296.5 Kb.
#102421
1   2
Bog'liq
Antiplagiat dastur yaratishda o

a. Negiz – berilgan so‘z “ishlamaganlarni”;

b. So‘z o‘zgartiruvchi qo‘shimchalarsiz hоlat — “ishlamaganlar”;

c. Shakl yasovchi qo‘shimchalarsiz hоlat – “ishla”;

d. So‘z yasovchi qo‘shimchasiz hоlat – “ish”;

e. O‘zak – so‘zning o‘zgarmas qismi.

1.2. Berilgan simvollar to‘plami – so‘zni bir holatdan ikkinchi holatga o‘tkazuvchi simvollardir. Bizning holatda esa bu o‘zbek tilidagi qo‘shimchalardir.

Σ={ni, lar, gan, ma, la} Wi

1.3. O‘tish funksiyasi – so‘zni bir holatdan boshqa holatga berilgan qo‘shimcha yordamida o‘tkazuvchi funksiya.



q– ishlaq0 – ish, kiruvchi qo‘shimcha –la

q1=δ (q, la ) =ishla

Dastlab, ChAni chapdan o‘nga (o‘zak + qo‘shimcha1 + qo‘shimcha2 + …) shaklida ishlab chiqamiz. Uni o‘ngdan chapga ishlaydigan qilish uchun δ ni teskari  tartibda ishlaydigan qilamiz, ya’ni Q0 = ishlaQ1-ishlа; Q1= δ (Q, la)

1.4 Natijaviy negiz to‘plam – bu so‘zning o‘zak qismidan tashkil topgan bo‘lib, mazkur jarayonda u faqat bitta elementga ega bo‘ladi. Natijaviy so‘z tarkibida kamida bitta unli harf bo‘lishi lozim. Ta’kidlab o‘tilganidek o‘zbek tilida so‘z tarkibi quyidagilardan tashkil topadi:

asos (o‘zak) + so‘z yasovchi + shakl yasovchi + so‘z o‘zgartiruvchi

So‘z tahlili so‘zni oxiridan boshlanadi va har bir qo‘shimcha faqatgina o‘zidan keyingi kelgan qo‘shimchalardan so‘ng tahlil qilinadi. Boshqacha qilib aytganda, so‘z tahlili o‘ngdan-chapga tartibida amalga oshiriladi.



1-rasm. O‘ngdan chapga ChA shakli

Xulosa qilib aytganda, o‘zbek tilidagi qo‘shimchalarni guruhlarga ajratib, so‘z tarkibidagi o‘zakni aniqlash jarayoni ChA asosida keltirildi. Matn tarkibidagi so‘zlarning o‘zaklarini aniqlash har bir so‘zni mazkur matn tarkibidagi qatnashish chastotasini aniqlashda asosiy omil bo‘lib xizmat qiladi. Bu esa matn tarkibidagi kalit so‘zlarni avtomatik ravishda aniqlash, matnlarni o‘xshashlikka tekshirish (har xil tillardagi) jarayonida qo‘l keladi. Mazkur ishning davomi sifatida o‘zbek tilidagi so‘zlarning o‘zagini aniqlash algoritmi Snowball kompilyatori uchun ishlab chiqiladi.

Adabiyotlar:



  1. F. Porter, Snowball: A language for Stemming Algorithms.-2011

  2. Erigit, E. Adali. An Affix stripping morphological analyzer for Turkish, 2004

  3. E. Hopcroft, R. Motwani, J. D. Ullman. Introduction to Automata Theory Languages and Com

Download 296.5 Kb.

Do'stlaringiz bilan baham:
1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling