Semantik o'xshashlik hujjatlar yoki atamalar to'plami bo'yicha aniqlangan o'lchovdir, bu erda ob'ektlar orasidagi masofa g'oyasi leksikografik o'xshashlikdan farqli o'laroq ularning ma'nosi yoki semantik mazmun o'xshashligiga asoslanadi. Bular til birliklari, tushunchalar yoki misollar o'rtasidagi semantik munosabatlarning kuchini, ularning ma'nosini tasdiqlovchi yoki ularning tabiatini tavsiflovchi ma'lumotlarni taqqoslash bo'yicha olingan raqamli tavsif orqali baholash uchun ishlatiladigan matematik vositalar.[1][2] Semantik o'xshashlik atamasi ko'pincha semantik yaqinlik bilan aralashtiriladi. Semantik yaqinlik ikki atama o'rtasidagi har qanday munosabatni o'z ichiga oladi, semantik o'xshashlik faqat "is" munosabatlarini o'z ichiga oladi.[3]Masalan, "mashina" "avtobus" ga o'xshaydi, lekin "yo'l" va "haydash" bilan ham bog'liq.
Hisoblash nuqtai nazaridan semantik o'xshashlikni aniqlash orqali aniqlash mumkin topologik o'xshashlik, foydalanish orqali ontologiyalar atamalar / tushunchalar orasidagi masofani aniqlash. Masalan, a da tartiblangan tushunchalarni taqqoslash uchun sodda metrik qisman buyurtma qilingan to'plam va a tugunlari sifatida ifodalangan yo'naltirilgan asiklik grafik (masalan, a taksonomiya ), ikkita kontseptsiya tugunlarini bog'laydigan eng qisqa yo'l bo'ladi. Matn tahlillari asosida til birliklari (masalan, so'zlar, jumlalar) o'rtasidagi semantik yaqinlikni, masalan, statistik vositalar yordamida baholash mumkin. vektor kosmik modeli ga o'zaro bog'liq mos keladigan so'zlar va matn kontekstlari matn korpusi. Tavsiya etilgan semantik o'xshashlik / o'xshashlik o'lchovlarini baholash ikki asosiy usul orqali baholanadi. Birinchisi, mutaxassislar tomonidan ishlab chiqilgan va semantik o'xshashlik / o'xshashlik darajasi bo'yicha so'z juftlaridan tashkil topgan ma'lumotlar to'plamlaridan foydalanishga asoslangan. Ikkinchi yo'l, ma'lumotlarni qidirish, tavsiya etuvchi tizimlar, tabiiy tilni qayta ishlash va h.k.larni aniq dasturlar ichidagi choralarni birlashtirishga asoslangan.
Terminologiya
Tushunchasi
Do'stlaringiz bilan baham: |