Dasturiy ta’minotni testlash
Download 100.86 Kb.
|
deadlineSH
Mavzu: Matnni aniqlash
Ishdan maqsad: Matnni tanib olish tizimi kiritish matnli tasvirni (grafik fayl ma'lumotlar formatida) o'z ichiga oladi. 0 Kerakli johozlar: kompyuter hamda internet. Nazariy qism Chop etilgan matndagi lotin harflarini aniq tanib olish hozircha faqat skanerlangan bosma hujjatlar kabi aniq tasvirlar mavjud bo‘lgandagina mumkin. Muammoning bu formulasi bilan aniqlik 99% dan oshadi; mutlaq aniqlikka faqat keyingi insoniy tahrir orqali erishish mumkin. Qo'lda yozilgan "bosma" va standart qo'lyozma matnni, shuningdek, boshqa formatdagi bosma matnlarni (ayniqsa, juda ko'p belgilar bilan) tanib olish muammolari hozirda faol tadqiqot mavzusidir. Onlayn belgilarni aniqlash ba'zan optik belgilarni aniqlash bilan aralashib ketadi. Ikkinchisi matnni ko'rsatishning statik shakli bilan ishlaydigan oflayn usul bo'lib, onlayn belgilarni aniqlash esa yozish paytidagi harakatlarni hisobga oladi. Masalan, PenPoint OS yoki planshet kompyuter yordamida onlayn tanib olishda siz chiziq o'ngdan chapga yoki chapdan o'ngga yozilganligini aniqlashingiz mumkin. Tez orada qo'l yozuvini tanib olish uchun onlayn tizimlar yaqinda tijorat mahsulotlari sifatida mashhur bo'ldi. Bunday qurilmalar uchun algoritmlar kirish liniyalarining alohida bo'limlarining tartibi, tezligi va yo'nalishi ma'lum bo'lganligidan foydalanadi. Bundan tashqari, foydalanuvchi faqat yozishning o'ziga xos shakllaridan foydalanishni o'rganadi. Ushbu usullarni skanerlangan qog'oz hujjatlarini ishlatadigan dasturiy ta'minotda qo'llash mumkin emas, shuning uchun qo'lda yozilgan "chop etilgan" matnni tanib olish muammosi hali ham ochiq qolmoqda. Artefaktlarsiz qo'lda yozilgan "bosma" matnli rasmlarda 80% - 90% aniqlikka erishish mumkin, ammo bu aniqlik bilan rasm sahifadagi o'nlab xatolar bilan o'zgartiriladi. Bunday texnologiya faqat juda cheklangan miqdordagi ilovalarda foydali bo'lishi mumkin. Yana bir keng o'rganilgan vazifa qo'lda yozilgan matnni aniqlashdir . Hozirgi vaqtda erishilgan aniqlik qo'lda yozilgan "bosma" matnga qaraganda ancha past. Yuqori ballga faqat kontekstual va grammatik ma'lumotlardan foydalangan holda erishish mumkin. Masalan, tanib olish jarayonida lug'atda butun so'zlarni qidirish matndagi alohida belgilarni aniqlashga urinishdan ko'ra osonroqdir. Til grammatikasini bilish so‘zning fe’l yoki ot ekanligini aniqlashga ham yordam beradi. Alohida qo'lda yozilgan belgilarning shakllari ba'zan butun qo'lda yozilgan matnni aniq tanib olish uchun etarli ma'lumotni o'z ichiga olmaydi (98% dan ko'proq). Download 100.86 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling