Matnni qayta ishlash uchun grafik modellar tomon


-rasm 95% ishonch darajasi bilan matnni tasniflash aniqligi (20 ta yangiliklar guruhi) To'liq o'lchamdagi rasm


Download 274.78 Kb.
bet11/16
Sana23.12.2022
Hajmi274.78 Kb.
#1044664
1   ...   8   9   10   11   12   13   14   15   16
Bog'liq
Matnni qayta ishlash uchun grafik modellar tomon

3-rasm

95% ishonch darajasi bilan matnni tasniflash aniqligi (20 ta yangiliklar guruhi)
To'liq o'lchamdagi rasm
4-rasm

95% ishonch darajasi bilan matn tasnifi aniqligi (Reuters-21578 R8)
To'liq o'lchamdagi rasm
5-rasm

95% ishonch darajasi bilan matn tasnifi aniqligi (Reuters-21578 R52)
To'liq o'lchamdagi rasm
Shuningdek, biz turli xil ma'lumotlar to'plamlari uchun masofaviy grafik tasvirlarining samaradorligini sinab ko'rdik. Biz shuni ta'kidlaymizki, yuqori tartibli masofali grafik tasvirlar ko'proq qirralarga ega va shuning uchun biroz sekinroq bo'lishi mumkin. uchun natijalaryigirmayigirmayangiliklar guruhlari ma'lumotlar to'plami, Reuters-2157821578Rsakkizsakkiz, va Reuters -2157821578R5252ma'lumotlar to'plamlari mos ravishda 6 - rasmda a-c tasvirlangan. Har bir holatda ishlash vaqtlari rasmda ko'rsatilganYY-eksa, masofa grafigini tasvirlash tartibi esa rasmda ko'rsatilganXX-o'q. Ushbu grafikda tartib -00vakillik vektor-fazo tasviriga (unigramma) mos keladi. Ko'rinib turibdiki, ish vaqti faqat vakillik tartibi bilan chiziqli ravishda oshadi. Pastroq tartibli tasvirlar uchun optimal natijalar olinganligi sababli, masofaviy grafik tasvirlar bilan natijalar sifatini yaxshilash uchun faqat ish vaqtini biroz ko'paytirish kerak bo'ladi.
6-rasm

Turli ma'lumotlar to'plamlarida tasniflash samaradorligi. a 20 Newsgroups, b Reuters 21578 R8, c Reuters 21578 R52
To'liq o'lchamdagi rasm
Klasterlash ilovasi
Biz klasterlash ilovasi uchun masofaviy grafik tasvirimizni qo'shimcha sinovdan o'tkazdik. Eksperimental tadqiqotlarimizda ikki xil matn klasterlash algoritmlari qabul qilingan: K-means [ 14 ] va ierarxik EM klasterlash [ 7 ]. Biz K-means algoritmini amalga oshirdik va Rainbow asboblar to'plamida klasterlash funksiyasini ta'minlovchi crossbow -da ierarxik EM klasterlash algoritmidan foydalandik [ 19 ]. Har bir klasterlash algoritmi uchun biz entropiyadan klasterlar sifati o'lchovi sifatida foydalandik [ 23 ] va turli xil asosiy ko'rinishlar bilan yaratilgan klasterlarning yakuniy entropiyalarini solishtirdik. Klasterlarning entropiyasini rasmiy ravishda quyidagicha aniqlash mumkin: KelingCCyuqorida aytib o'tilgan maxsus klasterlash algoritmi tomonidan yaratilgan klasterlash yechimi bo'lishi. Har bir klaster uchuncjcj, ichidagi ma'lumotlarning sinf taqsimoticjcjbirinchi bo'lib hisoblanadi: belgilaymizpmen jpija'zosi bo'lish ehtimoli sifatidacjcjsinfga tegishliii. Keyin, ning entropiyasicjcjquyidagicha hisoblanadi:
VAcj= −∑ipmen jl og(pmen j)VAcj=−∑ipijlOg(pij)
(2)
bu erda yig'indi barcha sinflar bo'yicha olinadi. To'plam uchun umumiy entropiyammKlasterlar soni har bir klasterning o'lchamiga qarab tortilgan har bir klasterning entropiyalarining yig'indisi sifatida quyidagicha hisoblanadi:
VAC=∑j = 1m|cj| ×VAcj∑mj = 1|cj|VAC=∑j=bittam|cj|×VAcj∑j=bittam|cj|
(3)
qayerda|cj||cj|klaster hajmidircjcj.
Biz K-vositalari va ierarxik EM klasterlash algoritmini vektor-fazo tasviri hamda masofaviy grafik usuli yordamida sinab ko'rdik. Natijalar mos ravishda 20 ta yangiliklar guruhi ma'lumotlar to'plami (7-rasm a ), Reuters-21578 R8 ma'lumotlar to'plami (7-b-rasm ) va WebKB ma'lumotlar to'plami (7-rasm c ) uchun natijalar rasmda ko'rsatilgan. Masofa grafigining tartibi rasmda ko'rsatilganXX-eksa, entropiya esa tasvirlanganYY-o'q. Standart vektor-fazo tasviri biz tartib-0 (unigram) dagi masofa grafigini ishlatgan holatga mos keladi. 7 -rasm natijalaridan ko'rinib turibdiki , entropiya masofa grafigining ortib borayotgan tartibi bilan kamayadi. Buning sababi shundaki, masofa grafigi masofaviy hisoblashlarni amalga oshirish uchun asosiy ma'lumotlarning tizimli xatti-harakatlaridan foydalanadi. Ushbu masofaviy hisoblashlarning yuqori sifati, shuningdek, umumiy klasterlash jarayoni uchun mos keladigan natijani yaxshilaydi.

Download 274.78 Kb.

Do'stlaringiz bilan baham:
1   ...   8   9   10   11   12   13   14   15   16




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling