Tushish (qatordan chiqish) (fall-out)
fall-out relevant bo’lmagan manbalarni topish ehtimolini tavsiflaydi va topilgan relevant bo’lmagan hujjatlar sonining ma’lumotlar bazasidagi relevant bo’lmagan hujjatlarning umumiy soniga nisbati sifatida aniqlanadi:
F-o’lchov (F-measure, Van Rizbergen o’lchovi)
P aniqlik va R to’liqlikning o’rta vaznli garmonik o’rtacha qiymati sifatida aniqlanadigan F-o’lchovdan foydalaniladi:
Odatda F-o’lchov quyidagi ko’rinishda ifodalanadi:
Axborotni ajratib olish
Axborotni ajratib olish (angl. information extraction) — bu komp’yuterda tayyorlangan aniq strukturaga ega bo’lmagan yoki kuchsiz strukturalashgan hujjatlardan aniq struturaga ega bo’lgan ma’lumotlarni avtomatik ajratib olish yoki qurish.
Axborotni ajratib olish tabiiy tildagi matnlarni qayta ishlab bilan bog’liq bo’lib, axborotlarni qidirishning bir ko’rinishi hisoblanadi.
“Kecha, 2019 yil 31 noyabr kuni Toshkent shahrida o’tkaziladigan Shanxay hamkorlik tashkilotiga a’zo davlatlarning hukumat rahbarlari uchrashuvida ishtirok etish uchun Rossiya Federatsiyasining bosh vaziri Dmitriy Medvedov Toshkent shahriga keldi”
Rasmiy vizit (davlat -Kim, Davlat-Kimga, kelish sanasi)
Ma’lumotlarni bunday akslantirishdan asosiy maqsad – boshlang’ich tarqoq (xatotik) axborotlarni ma’lumotlarni qayta ishlashning standart usullari yordamida tahlil qilish imkonini yaratishdan iborat. Shu bilan birgalikda xabar matnida tavsiflangan mantiqiy qonuniyatlarni aniqlash masalasi usun xizmat qilishi mumkin.
Axborotlarni ajratib olishning maxsus masalalari:
Nomlangan (ya’ni, muhim, tayanch) elementlarni tanish, masalan: odamlar ismi, tashkilot nomlari, geografik nomlar, vaqt va pul birliklari va h.k.
Anaformalar va o’zaklarning aniqlanishi: bitta va aynan shu ob’etga tegishli (daxldor) bog’liqliklarni aniqlash. Bunday bog’lanishlarning xos holatlari – olmoshli anaforalar.
Atamalarni (terminlarni) ajaratish: berilgan matn uchun kalit so’zlari va iboralarni topish.
Do'stlaringiz bilan baham: |