Rukn: Sharh va fikr-mulohazalar
Download 296.5 Kb.
|
Antiplagiat dastur yaratishda o
a. Negiz – berilgan so‘z “ishlamaganlarni”; b. So‘z o‘zgartiruvchi qo‘shimchalarsiz hоlat — “ishlamaganlar”; c. Shakl yasovchi qo‘shimchalarsiz hоlat – “ishla”; d. So‘z yasovchi qo‘shimchasiz hоlat – “ish”; e. O‘zak – so‘zning o‘zgarmas qismi. 1.2. Berilgan simvollar to‘plami – so‘zni bir holatdan ikkinchi holatga o‘tkazuvchi simvollardir. Bizning holatda esa bu o‘zbek tilidagi qo‘shimchalardir. Σ={ni, lar, gan, ma, la} Wi 1.3. O‘tish funksiyasi – so‘zni bir holatdan boshqa holatga berilgan qo‘shimcha yordamida o‘tkazuvchi funksiya. q1 – ishla, q0 – ish, kiruvchi qo‘shimcha –la q1=δ (q0 , la ) =ishla Dastlab, ChAni chapdan o‘nga (o‘zak + qo‘shimcha1 + qo‘shimcha2 + …) shaklida ishlab chiqamiz. Uni o‘ngdan chapga ishlaydigan qilish uchun δ ni teskari tartibda ishlaydigan qilamiz, ya’ni Q0 = ishla, Q1-ishlа; Q1= δ (Q0 , la) 1.4 Natijaviy negiz to‘plam – bu so‘zning o‘zak qismidan tashkil topgan bo‘lib, mazkur jarayonda u faqat bitta elementga ega bo‘ladi. Natijaviy so‘z tarkibida kamida bitta unli harf bo‘lishi lozim. Ta’kidlab o‘tilganidek o‘zbek tilida so‘z tarkibi quyidagilardan tashkil topadi:
So‘z tahlili so‘zni oxiridan boshlanadi va har bir qo‘shimcha faqatgina o‘zidan keyingi kelgan qo‘shimchalardan so‘ng tahlil qilinadi. Boshqacha qilib aytganda, so‘z tahlili o‘ngdan-chapga tartibida amalga oshiriladi. 1-rasm. O‘ngdan chapga ChA shakli Xulosa qilib aytganda, o‘zbek tilidagi qo‘shimchalarni guruhlarga ajratib, so‘z tarkibidagi o‘zakni aniqlash jarayoni ChA asosida keltirildi. Matn tarkibidagi so‘zlarning o‘zaklarini aniqlash har bir so‘zni mazkur matn tarkibidagi qatnashish chastotasini aniqlashda asosiy omil bo‘lib xizmat qiladi. Bu esa matn tarkibidagi kalit so‘zlarni avtomatik ravishda aniqlash, matnlarni o‘xshashlikka tekshirish (har xil tillardagi) jarayonida qo‘l keladi. Mazkur ishning davomi sifatida o‘zbek tilidagi so‘zlarning o‘zagini aniqlash algoritmi Snowball kompilyatori uchun ishlab chiqiladi. Adabiyotlar: F. Porter, Snowball: A language for Stemming Algorithms.-2011 Erigit, E. Adali. An Affix stripping morphological analyzer for Turkish, 2004 E. Hopcroft, R. Motwani, J. D. Ullman. Introduction to Automata Theory Languages and Com Download 296.5 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling