Samarqand davlat universiteti intellektual tizimlar va axborot texnologiyalari fakulteti


Download 290 Kb.
bet8/10
Sana24.12.2022
Hajmi290 Kb.
#1052189
1   2   3   4   5   6   7   8   9   10
Bog'liq
407-GURUH.FAYZULLAYEV.A BIG DATA

18.Samaradorlikni baholash
AQT tomonidan topilgan hujjatlar so’rovga qanchalik mos kelishini baholashning ko’plab usullari mavjud. Afsuski, so’rovlarning muvofiqlik darajasi, boshqacha aytganda relevantnosti, sub’ektiv tushuncha hisoblanadi, muvofiqlik darajasi esa so’rov bajarilishi natijalarini baholovchi aniq insonga bog’liq.
19.Aniqlik (precision)
Bu AQTlari tomonidan topilgan tegishli hujjatlar sonining topilgan hujjatlarning umumiy soniga nisbati sifatida aniqlanadi:
To’liqlik (recall)
Topilgan relevant hujjatlar sonining bazadagi umumiy relevant hujjatlar soniga nisbati:
Tushish (qatordan chiqish) (fall-out)
fall-out relevant bo’lmagan manbalarni topish ehtimolini tavsiflaydi va topilgan relevant bo’lmagan hujjatlar sonining ma’lumotlar bazasidagi relevant bo’lmagan hujjatlarning umumiy soniga nisbati sifatida aniqlanadi:
F-o’lchov (F-measure, Van Rizbergen o’lchovi)
P aniqlik va R to’liqlikning o’rta vaznli garmonik o’rtacha qiymati sifatida aniqlanadigan F-o’lchovdan foydalaniladi:
Odatda F-o’lchov quyidagi ko’rinishda ifodalanadi:
20.Axborotni ajratib olish
Axborotni ajratib olish (angl. information extraction) — bu komp’yuterda tayyorlangan aniq strukturaga ega bo’lmagan yoki kuchsiz strukturalashgan hujjatlardan aniq struturaga ega bo’lgan ma’lumotlarni avtomatik ajratib olish yoki qurish.
Axborotni ajratib olish tabiiy tildagi matnlarni qayta ishlab bilan bog’liq bo’lib, axborotlarni qidirishning bir ko’rinishi hisoblanadi.
“Kecha, 2019 yil 31 noyabr kuni Toshkent shahrida o’tkaziladigan Shanxay hamkorlik tashkilotiga a’zo davlatlarning hukumat rahbarlari uchrashuvida ishtirok etish uchun Rossiya Federatsiyasining bosh vaziri Dmitriy Medvedov Toshkent shahriga keldi”
Rasmiy vizit (davlat -Kim, Davlat-Kimga, kelish sanasi)
Ma’lumotlarni bunday akslantirishdan asosiy maqsad – boshlang’ich tarqoq (xatotik) axborotlarni ma’lumotlarni qayta ishlashning standart usullari yordamida tahlil qilish imkonini yaratishdan iborat. Shu bilan birgalikda xabar matnida tavsiflangan mantiqiy qonuniyatlarni aniqlash masalasi usun xizmat qilishi mumkin.

Download 290 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling