Bu erda keltirilgan atamalar haqida qisqacha ma'lumot Pochta xabarlarini aqlli tahlil qilish asosida elektron pochta spam yoki yo'qligini aniqlash uchun quyidagi qadamlar mavjud:
Oldindan ishlov berish: Birinchi qadam to'xtash so'zlari, tinish belgilari va boshqa ma'lumotga ega bo'lmagan elementlarni olib tashlash orqali elektron pochta xabarini oldindan qayta ishlashdir. Buni tokenizatsiya, stemming va lemmatizatsiya kabi usullar yordamida amalga oshirish mumkin. Xususiyatlarni ajratib olish: Keyingi qadam, elektron pochta xabarining spam yoki yo'qligini aniqlashga yordam beradigan tegishli xususiyatlarni olishdir. Ba'zi umumiy xususiyatlar jo'natuvchining elektron pochta manzili, mavzu satri, xabarning asosiy qismi va elektron pochtaga kiritilgan har qanday havolalar yoki qo'shimchalarni o'z ichiga oladi. O'quv ma'lumotlari: Keyinchalik, model spam yoki spam emas, deb etiketlangan elektron pochta ma'lumotlari to'plamidan foydalangan holda o'qitilishi kerak. Ushbu ma'lumotlar to'plami xilma-xil bo'lishi va odatda qabul qilinadigan elektron pochta turlarini ifodalovchi bo'lishi kerak. Model tanlash: Elektron pochta xabarlarini spam yoki spam emas deb tasniflash uchun ishlatilishi mumkin bo'lgan bir nechta mashina o'rganish algoritmlari mavjud. Ba'zi mashhur algoritmlarga Naive Bayes, Support Vector Machines va Random Forests kiradi.Modelni baholash: Model o'qitilgandan so'ng uni test ma'lumotlar to'plamidan foydalanib baholash kerak. Baholash ko'rsatkichlari aniqlik, aniqlik, eslab qolish va F1 ballini o'z ichiga olishi mumkin Joylashtirish: Nihoyat, model kiruvchi elektron pochta xabarlarini spam yoki spam emas deb avtomatik ravishda tasniflash uchun joylashtirilishi mumkin. Bu elektron pochta xabarlari qabul qilinganda real vaqtda amalga oshirilishi mumkin va har qanday spam xatlar avtomatik ravishda spam jildiga ko'chirilishi yoki o'chirilishi mumkin.Ushbu bosqichlarni bajarib, spam xatlarni aniq aniqlay oladigan va pochta qutingizdagi kiruvchi xabarlar sonini kamaytiradigan pochta xabarlari uchun aqlli tahlil tizimini ishlab chiqish mumkin.
Do'stlaringiz bilan baham: |