Lingvistik tahlil usuli to'g'ridan-to'g'ri fayl va hujjatning mazmuni bilan ishlaydi. Bu sizga fayl nomi, hujjatda shtampning borligi yoki yo'qligi, hujjatni kim yaratganligi va qachon kabi parametrlarni e'tiborsiz qoldirishga imkon beradi. Lingvistik tahlil texnologiyasi quyidagilarni o'z ichiga oladi.
morfologik tahlil - axborot tarqalishidan himoyalangan bo'lishi mumkin bo'lgan barcha so'z shakllarini izlash;
semantik tahlil - fayl tarkibidagi muhim (asosiy) ma'lumotlarning paydo bo'lishini qidirish, hodisalarning faylning sifat xususiyatlariga ta'siri, foydalanish kontekstini baholash.
Lingvistik tahlil katta hajmdagi ma'lumot bilan ishlashning yuqori sifatini ko'rsatadi. Katta hajmli matn uchun lingvistik tahlil algoritmiga ega bo'lgan DLP tizimi to'g'ri sinfni to'g'ri tanlaydi, kerakli toifaga kiritadi va tuzilgan qoidani ishga tushiradi. Kichik hujjatlar uchun spamga qarshi kurashda samaradorligini isbotlagan stop word texnikasidan foydalanish yaxshiroqdir.
Lingvistik tahlil algoritmiga ega tizimlarda o'rganish imkoniyati amalga oshiriladi yuqori daraja... Dastlabki DLP komplekslari toifalarni va "o'rganish" ning boshqa bosqichlarini belgilashda qiyinchiliklarga duch keldi, ammo zamonaviy tizimlar o'z-o'zini o'rganish algoritmlariga ega: toifalarning belgilarini aniqlash, reaktsiya qoidalarini mustaqil ravishda shakllantirish va o'zgartirish qobiliyati. Kirish uchun axborot tizimlari Ma'lumotlarni himoya qilish uchun bunday dasturiy ta'minot tizimlari endi tilshunoslarning ishtirokini talab qilmaydi.
Lingvistik tahlilning kamchiliklari rus tilidagi axborot oqimlarini tahlil qilish uchun "inglizcha" yadroli DLP tizimidan foydalanish imkonsiz bo'lganida, ma'lum bir til bilan bog'lanish bilan bog'liq. Yana bir kamchilik, ehtimoliy yondashuvdan foydalangan holda aniq tasniflashning murakkabligi bilan bog'liq bo'lib, javobning aniqligini 95% darajasida ushlab turadi, shu bilan birga har qanday miqdordagi maxfiy ma'lumotlarning tarqalishi kompaniya uchun juda muhimdir.
Do'stlaringiz bilan baham: |