Texnologiyalari universiteti “Ma'lumotlarning intellektual tahlili” fani Mustaqil ish Mavzu


-rasm Elektron pochtadagi yashirin matnga misol. Misol Bryus Guenter 2020 dan olingan 3.3 Rasmga asoslangan spam elektron pochta


Download 1.35 Mb.
bet10/15
Sana23.04.2023
Hajmi1.35 Mb.
#1388517
1   ...   7   8   9   10   11   12   13   14   15
Bog'liq
Pochta xabarlarini intellectual

1-rasm

Elektron pochtadagi yashirin matnga misol. Misol Bryus Guenter 2020 dan olingan

3.3 Rasmga asoslangan spam elektron pochta


2000-yillarning o'rtalarida spamerlar spam-xabarni elektron pochtaga yozish o'rniga tasvirlarga kiritishni boshladilar. Tasvirga asoslangan spam matnni qayta ishlashni samarasiz qildi (Biggio va boshq. 2011 ).
O'sha davrda spam-tasvirlarning jambon yoki spamga ikkilik tasnifini taqdim etgan bir nechta ishlar nashr etildi (Byun va boshq. 2007 ; Mehta va boshq. 2008 ; Vang va boshq. 2007 ). Tavsiya etilgan tasniflagichlarni baholash uchun tadqiqotchilar elektron pochta xabarlaridan olingan jambon va spam-tasvirlarning bir nechta ma'lumotlar to'plamini yaratdilar va ommaga taqdim etdilar. Eng mashhur tasvir ma'lumotlar to'plami - Image Spam Dataset (Dredze va boshq. 2007 ), Standard Dataset yoki Image Spam Hunter (Gao va boshq. 2008 ) va Princeton Spam Image Benchmark (Wang va boshq. 2007 ). Bundan tashqari, Biggio va boshqalar. ( 2007 ) OCR vositalarini yengish uchun kontentni yashirish usullaridan foydalanish kabi tasvirlardagi spamer hiylalariga duch keldi.
So'nggi modellar mashinani o'rganish algoritmlari va tasvir xususiyatlaridan foydalanilgan, masalan, metadata yoki rang xususiyat sifatida (Aiwan and Zhaofeng 2018 ; Chavda et al. 2018 ; Zamil et al. 2019 ). Mualliflar o'z modellarini yuqorida qayd etilgan ma'lumotlar to'plamlari bo'yicha o'qitib, yuqori samaradorlikka erishdilar. Biroq, tasvirga asoslangan spamni yaratish texnikasi rivojlandi va spamerlar 2- rasmda ko'rsatilganidek, xabar mazmuni formatini va tasvir ko'rinishini o'zgartirdilar . Annadatha va Stamp ( 2016 ) Standart ma'lumotlar to'plamida asosiy komponent tahlili (PCA) va SVM yondashuvlarini baholadi (Gao va boshq. 2008) .) va o'zlarining shaxsiy va takomillashtirilgan ma'lumotlar to'plami 2016 yilda to'planib, standart ma'lumotlar to'plamida shaxsiyga qaraganda ancha yuqori ko'rsatkichlarga erishdi. Yangi va ko'rilmagan ma'lumotlar to'plamlariga nisbatan bu degradatsiyani bartaraf etish uchun Kim va boshqalar. ( 2020 ) ma'lumotlarni ko'paytirishga asoslangan texnikalar bilan birga CNN-XGBoost modelini yaratdi.
Xulosa qilib aytganda, hozirgi spam-tasvirlarni o'z ichiga olgan so'nggi ma'lumotlar to'plamlarida baholangan modellarning yo'qligi bizni 00-yillarning oxiridagi ma'lumotlar to'plamida ko'rsatilgan yuqori unumdorlik so'nggi ma'lumotlar to'plamlarida yomonlashadimi yoki yo'qmi degan savolga olib kelishi mumkin. Bundan tashqari, Naiemi va boshqalar. ( 2019 ) biriktirilgan rasmlardan harflar va so'zlarni ajratib olish uchun tasvirga asoslangan spamni OCR nuqtai nazaridan ko'rib chiqdi. Dhah va boshqalar. ( 2019 ) har birini alohida ishlatmasdan, matn va tasvir xususiyatlarini qayta ishlash orqali tasniflash samaradorligini oshirishga erishdi.
Tajriba natijalari shuni ko'rsatdiki, rasm va matn xususiyatlarining kombinatsiyasi faqat tasvir yoki matn xususiyatlaridan foydalanilgan holda tasniflash samaradorligini oshiradi.
2-rasm

Rasmga asoslangan spamga misollar. Rasm a) 2007-yilgi Spam-ma’lumotlar to‘plamidan olingan tasvir, b) esa 2019-yilgi spam-xatlarning shaxsiy to‘plamidan namunadir.

3.4 Boshqa rivojlanayotgan strategiyalar


Spam elektron pochta ochiq qurol poygasi bo'lganligi sababli, spamerlar doimiy ravishda ularga qarshi har qanday avansni chetlab o'tish uchun muqobil strategiyalarni izlaydilar. Oldingi strategiyalarga rioya qilgan holda, biz spamerlar e-pochta formatlari va qo‘shimchalaridagi har qanday qoidabuzarlikdan foydalanib, o‘z hiylalarini foydalanuvchidan yashirishini tasdiqlashimiz mumkin.
Alazab va Broadhurst ( 2016 ), Ferrara ( 2019 ) va Tran va boshqalarga ko'ra . ( 2013 ), elektron pochtaga kiritilgan qo'shimchalar va URL manzillar zararli fayllarning asosiy vektorlaridan biridir. Ba'zi ishlar (Arivudainambi va boshq. 2019 ; Cohen et al. 2018 ) veb-pochta fayllarida zararli dasturlarni aniqlash uchun modelni taklif qildi. Biroq, biriktirilgan fayllar va URL manzillar zararli dasturlarni almashish uchun kanca va spam-xabarni elektron pochta orqali uzatish vositasi bo'lishi mumkin. PDF yoki docx kabi fayl kengaytmalari pochta mijozi interfeysida xabarni ko'rsatishga imkon beradi va shu bilan birga elektron pochta matni yoki tasviriga qaratilgan matn filtridan qochadi.
Ko'rinib turibdiki, qonuniy elektron pochta spam-xabarni o'z ichiga olgan rasmlarni yuklaydigan yoki haqiqiy spam veb-saytiga havola qiladigan URL manzillarini o'z ichiga olishi mumkin. Joriy spam xatlar odatda tasvirlarni biriktirishdan qochadi va ularni HTML kod ichidagi havolalar orqali to'g'ridan-to'g'ri yuklaydi. URL manzillari bu sohada ochiq muammoga aylangan va qo'shimcha tadqiqotlarga loyiq bo'lgan fishing elektron pochta xabarlarida keng qo'llaniladi (El Aassal et al. 2020 ; Gupta et al. 2017 ). Biz 4- rasmda PDF yoki docx kabi rasmlar yoki boshqa fayllarni o'z ichiga olgan spam-pochtaning foizli evolyutsiyasini ilova yoki inline shakl sifatida tasvirlaymiz. Biz Bryus Guenterning spam arxividan olingan so'nggi o'n yildagi spam xatlarni tahlil qildik.
Biz 3- rasmda hech bo'lmaganda rasm va boshqa fayllarni o'z ichiga olgan spam-pochta foizining evolyutsiyasini ilova yoki inline shakl sifatida tasvirlaymiz. 3 -rasmda biz tsiklik xatti-harakatni ko'rishimiz mumkin, elektron pochta xabarlariga biriktirilgan tasvirlar 2010 yildan 2012 yilgacha o'sdi, 2015 yildan 2017 yilgacha pasayib, 2017 yilda minimal darajaga yetdi (0,06 %0,06%biriktirilgan rasmlar bilan elektron pochta xabarlari va0,18 %0,18%boshqa qo'shimchalar bilan) va nihoyat, 2017 yildan 2019 yilgacha yana paydo bo'ldi. Mohammad ( 2020 ) allaqachon spam elektron pochtadagi drift kontseptsiyasi tsiklik ekanligini, ya'ni ba'zi xususiyatlar ma'lum vaqt oralig'ida yo'qolib, keyinroq qaytib kelishini ta'kidladi.
3-rasm

Grafikda so'nggi o'n yil ichida biriktirilgan rasmlar yoki boshqa fayllarni o'z ichiga olgan spam elektron pochta xabarlarining foizi (Y o'qi) tasvirlangan (X o'qi). Biz Bryus Guenterning Spam Arxivi tomonidan taqdim etilgan spam xatlardan foydalandik va ichki va biriktirilgan shakldagi rasm yoki boshqa faylni o'z ichiga olgan spam xatlarni ko'rib chiqdik.

Download 1.35 Mb.

Do'stlaringiz bilan baham:
1   ...   7   8   9   10   11   12   13   14   15




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling