Matnni qayta ishlash uchun grafik modellar tomon


Download 274.78 Kb.
bet7/16
Sana23.12.2022
Hajmi274.78 Kb.
#1044664
1   2   3   4   5   6   7   8   9   10   ...   16
Bog'liq
Matnni qayta ishlash uchun grafik modellar tomon

Ta'rif 2.2
Buyurtmaning yo'naltirilmagan masofa grafigikkhujjat uchunDDkorpusdan olinganCCgrafik sifatida aniqlanadiG ( C, D , k ) = ( N( C) , A ( D , k ) )G(C,D,k)=(N(C),A(D,k)), qayerdaN( C)N(C)tugunlar to'plamidir vaA ( D , k )A(D,k)hujjatning qirralari to'plamidir. To'plamlarN( C)N(C)vaA ( D , k )A(D,k)quyidagicha aniqlanadi:

  • To'plamN( C)N(C)butun hujjat korpusidagi har bir alohida so'z uchun bitta tugunni o'z ichiga oladi.

  • To'plamA ( D , k )A(D,k)tugunlar orasidagi yo'naltirilmagan chetni o'z ichiga oladiiivajjso'z bo'lsaiiva so'zjjeng ko'p masofada sodir bo'ladi kkpozitsiyalar. Masalan, ketma-ket so'zlar uchun qiymatikk1. Chetning chastotasi - bu so'zning necha marta soniiiva so'zjjbilan ajratiladikkhujjatdagi pozitsiyalar.

To'plamA ( D , k )A(D,k)har bir tugundan o'ziga yo'naltirilmagan chetni o'z ichiga oladi . Chetning chastotasi so'z masofa bilan sodir bo'lgan umumiy soniga tengkkhar qanday yo'nalishda o'z- o'zidan . Shuning uchun chekka chastotasi hech bo'lmaganda hujjatdagi mos keladigan so'zning chastotasiga teng.
Masofaviy grafiklar bo'yicha ushbu birinchi maqolada biz yo'naltirilmagan o'zgarishlarni juda keng o'rganmaymiz, lekin uni qazib olish uchun samarali imkoniyat sifatida qisqacha eslatib o'tamiz. Ushbu maqolada ilgari ko'rib chiqilgan misol uchun yo'naltirilmagan masofa grafigining tasviri 2 -rasmda keltirilgan.. Bu holda biz ikkinchi tartibli masofa grafigini tasvirlab berdik. Ko'rinib turibdiki, yo'naltirilmagan masofa grafigi yo'naltirilgan grafikdan yo'naltirilgan qirralarni bir xil chastotali yo'naltirilmagan qirralar bilan almashtirish orqali olinishi mumkin. Ikkala yo'nalishda qirralar mavjud bo'lsa, biz ikki tomonlama qirralarning chastotalarini qo'shish orqali mos keladigan yo'naltirilmagan qirralarning chastotalarini olishimiz mumkin. Misol uchun, "kichik" va "qo'zichoq" o'rtasidagi yo'naltirilmagan chekka chastotasi 1 -rasmdagi yo'naltirilgan qirralarning chastotasining yig'indisidir . Yo'naltirilmagan vakillik buyurtma haqida ba'zi ma'lumotlarni yo'qotadi, lekin baribir masofalar haqidagi ma'lumotlarni saqlab qoladi. Ushbu maqola ushbu taqdimotga qaratilmagan bo'lsa-da, biz buni eslatib o'tamiz, chunki u ko'p stsenariylarda foydali bo'lishi mumkin:

  • Yo'naltirilmagan grafiklar ko'pincha qazib olish texnikasining kengroq to'plamini taqdim etadi, chunki yo'naltirilmagan grafiklarni qayta ishlash yo'naltirilgan grafiklarga qaraganda osonroq. Bu ko'p stsenariylarda amaliy afzallik bo'lishi mumkin.

  • Ushbu maqola tillararo qidiruvga e'tibor qaratilmagan bo'lsa-da, yo'naltirilgan grafiklar bunday stsenariylar uchun juda qattiq bo'lishi mumkin. Turli tillar ma'lum bir matn fragmenti uchun bir xil so'z tarjimalarini ifodalashi mumkin bo'lsa-da, tilga qarab tartib biroz boshqacha bo'lishi mumkin. Bunday hollarda, yo'naltirilmagan vakillik samarali ishlov berish uchun zarur bo'lgan moslashuvchanlikni ta'minlashi mumkin.


Download 274.78 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   ...   16




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling