Ҳужжатларни таснифлаш (классификацияси) ҳақида умумий тушунча


Баланссиз маълумотларнинг таснифлаш аниқлигига таъсири


Download 155.33 Kb.
bet9/10
Sana03.12.2023
Hajmi155.33 Kb.
#1799036
1   2   3   4   5   6   7   8   9   10
Bog'liq
Ҳужжатларни таснифлаш

1. Баланссиз маълумотларнинг таснифлаш аниқлигига таъсири


Таснифлаш вазифаларидаги номутаносиб маълумотлар таснифлашнинг аниқлигига сезиларли таъсир кўрсатиши мумкин. Синфлар тақсимоти нотўғри бўлса, классификатор кўпчилик синфига нисбатан мойил бўлиб, озчилик синфида ёмон ишлашга олиб келади. Ушбу номутаносиблик эслаб қолиш, аниқлик ва умумий аниқликнинг пасайишига олиб келиши мумкин (Саито & Реҳмсмеиер, 2015). Ушбу муаммони ҳал қилиш учун турли хил усуллар таклиф қилинган, масалан, қайта намуна олиш усуллари, харажатларни ҳисобга олувчи ўрганиш ва ансамбл усуллари (Ҳе, Баи, Гарcиа, & Ли, 2009; Жапкоwиcз & Степҳен, 2002). Ушбу усуллар озчиликлар синфини ортиқча танлаш ёки кўпчилик синфини кам танлаб олиш ёъли билан маълумотлар тўпламини мувозанатлаштиришга, иккала синфга бир хил аҳамият бериш орқали таснифлаш самарадорлигини оширишга қаратилган. Баланссиз маълумотларнинг таъсирини юмшатиш орқали ушбу усуллар ҳужжатларни таснифлашда аниқроқ ва ишончли натижаларга эришишга ёрдам беради.
2. Синф номутаносиблигини бартараф этиш усуллари
Ҳужжатларни таснифлашда синф номутаносиблигини бартараф этиш учун бир нечта усуллардан фойдаланиш мумкин.
Кенг тарқалган ёндашувлардан бири бу ҳаддан ташқари намуна олишдир, бунда озчиликлар синфи ўқув маълумотларидаги вакиллигини ошириш учун такрорланади. Яна бир усул - кам намуна олиш, бунда кўпчилик синфдаги мисоллар тасодифий танланади ва олиб ташланади. Бундан ташқари, тадқиқотчилар қўшни мисоллар асосида озчилик синфининг синтетик намуналарини яратадиган синтетик озчиликни ортиқча намуна олиш техникаси (СМОТЕ) каби гибрид усуллардан фойдаланишни ўрганишди. Ушбу усуллар мувозанатсиз маълумотлар тўпламларида таснифлагичларнинг ишлашини яхшилаш учун кўрсатилди (Фернáндез ва бошқ., 2018).
Ҳужжатларни таснифлаш табиий тилни қайта ишлашда ҳал қилувчи вазифадир, чунки у матнларни мазмунига қараб олдиндан белгиланган синфларга ёки тоифаларга ажратишни ўз ичига олади. Турли соҳаларда, жумладан, матнни қазиб олиш, маълумот олиш ва ҳиссиётларни таҳлил қилишда кенг қўлланилиши туфайли у катта эътиборга сазовор бўлди (Лиу & Зҳанг, 2012; Жоачимс, 1998). Бу жараён ҳар бир ҳужжат маълум бир синфга тайинланган ёрлиқли маълумотлар тўпламида моделни ўргатиш ва кейин ёрлиқсиз ҳужжатлар синфини башорат қилиш учун ушбу ўргатилган моделдан фойдаланишни ўз ичига олади (Чжан ва бошқ., 2019). Ҳужжатларни таснифлашда қўллаб-қувватловчи векторли машиналар, содда Баес классификаторлари ва конволютсион нейрон тармоқлари ва такрорий нейрон тармоқлар каби чуқур ўрганиш моделлари каби турли усуллар қўлланилган (Ду & Зҳанг, 2018; Зҳанг ва бошқ., 2018). Умуман олганда, ҳужжатлар таснифи катта ҳажмдаги матнли маълумотларни ташкил қилиш ва қайта ишлашда муҳим рол ўйнайди, бу турли соҳаларда самарали маълумотларни қидириш ва таҳлил қилиш имконини беради.


Хулоса қилиб айтганда, ҳужжатларни таснифлаш мураккаб вазифа бўлиб, ҳужжатларни мазмунига кўра туркумлаштиришни ўз ичига олади. Ушбу жараённи автоматлаштириш учун турли хил техника ва алгоритмлар ишлаб чиқилган, жумладан, қоидаларга асосланган ёндашувлар, машинани ўрганиш моделлари ва чуқур ўрганиш архитектуралари. Бироқ, соҳадаги ютуқларга қарамай, тузилмаган маълумотлар билан ишлаш ва контекстга боғлиқ маълумотларни аниқлаш каби ҳал қилиниши керак бўлган
баъзи муаммолар мавжуд. Умуман олганда, ҳужжатлар таснифи турли соҳалар ва соҳаларда ахборотни ташкил қилиш ва
самарадорликни оширишда ҳал қилувчи рол ўйнайди (Кҳатонй ва бошқ., 2019). Бу маълумотларни яхшироқ қидириш, тезроқ қарор қабул қилиш ва маълумотларни таҳлил қилишни яхшилаш имконини беради, бу эса ташкилотларда самарадорлик ва иш фаолиятини яхшилашга олиб келади (Қи ва бошқ., 2016). Бундан ташқари, ҳужжатларни таснифлаш ахборот хавфсизлиги ва махфийлигига ҳам таъсир қилади, чунки у нозик ёки махфий маълумотларни аниқлаш ва ҳал қилишда ёрдам беради (Деҳгҳан ва бошқ., 2019). Шу сабабли, ушбу соҳадаги кейинги тадқиқотлар ва ишланмалар мавжуд муаммоларни бартараф этиш ва ҳужжатларни таснифлашнинг мумкин бўлган афзалликларини максимал даражада ошириш учун муҳим аҳамиятга эга.

Download 155.33 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling