Диссертациянинг асосий мазмуни


-расм. Электрон почта хабарларини фильтрлашнинг интеллектуал тизими


Download 0.56 Mb.
bet3/4
Sana16.06.2023
Hajmi0.56 Mb.
#1518896
TuriДиссертация
1   2   3   4
Bog'liq
ДИССЕРТАЦИЯНИНГ АСОСИЙ МАЗМУНИ

4-расм. Электрон почта хабарларини фильтрлашнинг интеллектуал тизими
Иккинчи параграфда спам хабарларни аниқлашнинг таянч вектор усули ёрдамида ўқув танланма билан ўқитиш, яьни ҳар бир категория учун қайси категорияда эканлиги олдиндан маълум бўлган намуналар ҳисобга олинган ҳолда ўқитиш ва ҳужжатларни аниқланган тавсифи асосида индуктив тарзда ўқитиш натижасида классификатор ёрдамида икки тоифага ажратиб олиш имконини берадиган спам хабарларни аниқлашнинг модификасияланган таянч вектор усули ва алгоритми ишлаб чиқилган.
Электрон почтанинг ихтиёрий x ҳабари(spam ёки ham)ни n-ўлчовли белгилар тизими (вектори) ёрдамида ифодаланилади(4):
x=(x1,x2, … , xn) (4)
Электрон почтанинг икки синф ҳабарлари(spam ёки ham)ни қуйидаги n-ўлчовли белгилар тизими билан ифодаланган объектлар (ҳабарлар) тўплами кўринишида ифодалаб олинади(5):
(5)
бу ерда - р –инчи синфдаги i –нчи объектга тегишли j –инчи белгининг сон қиймати, m-берилган синфлар сони, kp - р–инчи синфдаги объектлар сони.
(6)
Классификатор сифатида таянч вектор усулида иккала синфни оптимал тарзда фазода ажратувчи гипертекисликнинг
(7)
(7 )тенгламасини топиш ҳисобланади. x объектининг F функциясини Y синф ёрлиғига айлантиришнинг умумий кўриниши(8):
. (8)
Бу ерда
(9)
белгилашлар киритилган. ω ва b ўқитиш алгоритм вазн коэффициентлари (номаълум параметрлари) созлангандан сўнг, қурилган гипертекисликнинг бир томонига тушган барча объектлар биринчи синф, иккинчи томонига тушган объектлар эса иккинчи синф сифатида белгиланади.

5-расм. Спам хабарларни аниқлашнинг модификацияланган таянч вектор алгоритмининг блок схемаси.
Учинчи параграфда логистик регрессия усулини Растригиннининг мослашувчан тасодифий қидирув усули билан қўлланилган ҳолда хабар хусусиятлари ичидан энг кўп спам бўлиш эҳтимоллигини топиш орқали таснифлаш вазифасини ечиш ишончлилигини ва спам хабарни аниқлаш тизимининг тезлигини ошириш имконига эга бўлинган.
Логистик регрессия (ЛР) модели:
(10)
учун оптимизациялаш, яьни махсималлаштириш критериясини қуйидаги кўринишда ёзиб олинади:
(11)
Бу ерда
(12)
(10),(12) шартлардан фойдаланиб, (11) оптималлаштириш критерийсини қуйидаги кўринишда ёзиб олиш мумкин:
(13)
Бу ерда
= w , = 1, = b.
Оптималлаштириш масаласи
, (14)
(15)
(16)
Бу ерда .
Ҳосил бўлган (14)-(16) оптималлаштириш масаласини стохастик тасодифий қидирув усулларининг асосчиси Л.А.Растригин томонидан таклиф этилган мослашувчан(адаптив) тасодифий қидирув усулидан фойдаланиб ечилади.
Мослашувчан тасодифий қидирув усули. Умумий ҳолда қуйидаги оптималлаштириш масаласи қўйилган бўлсин
(17)

бу ерда q( ) – умумий ҳолда ночизиқли кўп ўзгарувчили функция
,
– (17) масаланинг ечими.
D – оптималлаштириш масаласининг аниқланиш соҳаси, одатда тенглик ва тенгсизликлар кўринишида берилиши мумкин.
Мослашувчан тасодифий қидирув усулида қуйидаги реккурент формуладан фойдаланилади:
, (18)
(19)
– (к+1) қадамнинг узунлигини характерловчи параметр.
Диссертациянинг «Спам хабарларни аниқлаш жараёни самарадорлигини баҳолаш ва амалиётга тадбиқ этиш натижалари» номли тўртинчи бобида электрон почта хабарларидан спам хабарларни аниқлаш усулларининг самарадорлигини баҳолаш ҳамда cпам хабарларни аниқлашни дастурий воситасининг функционал структураси ва ишлаш принципи ҳамда жорий этишдан олинган тажриба-ҳисоблаш натижалари келтирилган.
Биринчи параграфда Спам хабарларни аниқлашда модификацияланган таянч вектор усулининг самарадорлиги учта асосий кўрсаткич бўйича баҳоланган. Бунда электрон почта спами(ЭПС), ижтимоий тармоқлардаги спам (ИТС), форумлардаги спам(ФС), сайтлардаги шарҳлар орқали тарқатиладиган спам (СШТС), каталоглар ва бюллетенлар кўринишидаги спам (КБС), смс спамлар (СС).

Download 0.56 Mb.

Do'stlaringiz bilan baham:
1   2   3   4




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling