Представлена в редакцию


Таблица 5. Сравнение -метрики на втором наборе тестовых данных  Название статьи


Download 1.31 Mb.
Pdf ko'rish
bet9/13
Sana19.06.2023
Hajmi1.31 Mb.
#1603028
1   ...   5   6   7   8   9   10   11   12   13
Bog'liq
raspoznavanie-botov-v-onlaynovyh-sotsialnyh-setyah-pri-pomoschi-algoritma-sluchaynyy-les

Таблица 5. Сравнение
-метрики на втором наборе тестовых данных 
Название статьи 
Используемый алгоритм 
Значение  
-меры 
BotOrNot: A system to evaluate social 
bots [25] 
«Случайный лес» с более 1000 
признаков 
0.761 
Empirical evaluation and new design 
for fighting evolving Twitter 
spammers [19] 
«Случайный лес» с разрабо-
танным в статье набором при-
знаков 
0.524 
Twitter Spammer Detection Using 
Data Stream Clustering [26] 
Алгоритм кластеризации 
DenStream 
0.370 
A generic statistical approach for spam 
detection in online social networks 
[10] 
Марковский алгоритм класте-
ризации 
0.923 
DNA-inspired online behavioral mod-
eling and its application to spambot 
detection [27] 
Сравнение «цифровой ДНК» 
аккаунтов 
0.923 
Распознавание ботов в онлайновых 
социальных сетях при помощи ал-
горитма «Случайный лес» 
«Случайный лес» с 9 призна-
ками аккаунтов 
0.963 
Как видно, обученный в данной статье алгоритм является довольно эффективным по 
сравнению с другими работами. 
5
В статье используются различные алгоритмы машинного обучения, основная цель статьи была пока-
зать эффективность разработанных признаков. Однако наиболее хорошие результаты показал алгоритм 
«Случайный лес» 


Машиностроение и компьютерные технологии
 
35 
Заключение 
Для распознавания ботов в онлайновой социальной сети Twitter был использован ал-
горитм машинного обучения «Случайный лес». В качестве исходных данных для обуче-
ния и тестирования алгоритма была использована база данных из нескольких тысяч акка-
унтов Twitter, состоящей как из обычных пользователей, так из нескольких видов ботов. 
Стоит отметить, что для обучения алгоритма были использованы только 9 признаков ак-
каунтов Twitter. При помощи алгоритма кросс-валидации были подобраны оптимальные 
гиперпараметры алгоритма, в качестве которых рассматривались число и глубина деревь-
ев. На обученном алгоритме с оптимальным набором гиперпараметров было произведено 
тестирование на случайном наборе данных и получено значение F
1
-метрики равной 0.972. 
Кроме того, было произведено тестирование на двух дополнительных наборах данных для 
сравнения с другими работами, в результате которого были получены значения F
1
-метрик 
равные 0.973 и 0.963. Полученные значения являются довольно высокими по сравнению с 
тестами алгоритмов других авторов. 

Download 1.31 Mb.

Do'stlaringiz bilan baham:
1   ...   5   6   7   8   9   10   11   12   13




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling