Ҳужжатларни таснифлаш (классификацияси) ҳақида умумий тушунча


Ҳужжатларни таснифлашнинг турли соҳалардаги аҳамияти


Download 155.33 Kb.
bet2/10
Sana03.12.2023
Hajmi155.33 Kb.
#1799036
1   2   3   4   5   6   7   8   9   10
Bog'liq
Ҳужжатларни таснифлаш

Ҳужжатларни таснифлашнинг турли соҳалардаги аҳамияти
Ҳужжатларни таснифлаш маълумот олиш, маълумотларни қидириш ва машинани ўрганиш каби турли соҳаларда ҳал қилувчи рол ўйнайди. Ахборот қидиришда ҳужжат таснифи фойдаланувчи сўровлари асосида маълумотларни самарали қидириш ва саралаш имконини беради (Лиу ва бошқ., 2010). Маълумотни қазиб олишда ҳужжатлар таснифи катта маълумотлар тўпламидаги нақш ва тендентсияларни аниқлаш учун ишлатилади, бу эса ташкилотларга маълумотларга асосланган қарорлар қабул қилиш имконини беради (Ҳан ва бошқ., 2011).
Бундан ташқари, машинани ўрганишда матнли маълумотларни автоматик равишда таснифлаш ва тартибга солиш учун алгоритмларни ўргатиш учун ҳужжатларни таснифлаш жуда муҳимдир (Себастиани, 2002). Шундай қилиб, ҳужжатларни таснифлашнинг аҳамиятини ошириб бўлмайди, чунки у турли соҳаларда ахборотни бошқариш ва қарорлар қабул қилиш жараёнларини такомиллаштиришга сезиларли ҳисса қўшади.
Ҳужжатларни таснифлаш ҳақида умумий тушунчага эришиш учун турли ёндашувлар таклиф қилинган. Кенг тарқалган ёндашувлардан бири сўзлар тўплами моделига асосланади, бу эрда ҳужжатлар сўз частоталари векторлари сифатида тақдим этилади. Яна бир ёндашув ҳужжатларни олдиндан белгиланган тоифаларга таснифлаш учун этикетли ўқув тўпламларида ўқитиладиган Суппорт Веcтор Мачинес (СВМ) каби машинани ўрганиш алгоритмларидан фойдаланишни ўз ичига олади. Ушбу ёндашувлар турли хил иловаларда, жумладан спам филтрлаш ва ҳиссиётларни таҳлил қилишда самарали эканлиги исботланган (Лиу, 2012).
Ҳужжатларни таснифлаш турлари
Ҳужжатларни таснифлашнинг турли хил турлари мавжуд бўлиб, улар ҳар хил турдаги ҳужжатларни тоифаларга ажратиш учун ишлаб чиқилган. Бундай усуллардан бири қоидаларга асосланган ёндашув бўлиб, ҳужжатларни маълум атрибутлар ёки калит сўзлар асосида таснифлаш учун олдиндан белгиланган қоидалардан фойдаланишни ўз ичига олади (Ким, 2018).
Яна бир усул - бу маълумотлардаги нақшларни автоматик равишда ўрганиш ва ҳужжатларни мос равишда таснифлаш учун алгоритмлардан фойдаланадиган машинани ўрганиш ёндашуви (Зҳанг, 2017).
Бундан ташқари, тегишли тоифаларга ажратиш учун ҳужжатларнинг статистик хусусиятларини таҳлил қилишни ўз ичига олган статистик ёндашув ҳам мавжуд (Маннинг, Рагҳаван ва Счüтзе, 2008). Ҳужжатларни таснифлашнинг ушбу турли хил турлари таснифланаётган ҳужжатларнинг ўзига хос талаблари ва хусусиятларига қараб турли хил афзаллик ва камчиликларни тақдим этади.

Download 155.33 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling