Представлена в редакцию
Таблица 5. Сравнение -метрики на втором наборе тестовых данных Название статьи
Download 1.31 Mb. Pdf ko'rish
|
raspoznavanie-botov-v-onlaynovyh-sotsialnyh-setyah-pri-pomoschi-algoritma-sluchaynyy-les
Таблица 5. Сравнение
-метрики на втором наборе тестовых данных Название статьи Используемый алгоритм Значение -меры BotOrNot: A system to evaluate social bots [25] «Случайный лес» с более 1000 признаков 0.761 Empirical evaluation and new design for fighting evolving Twitter spammers [19] «Случайный лес» с разрабо- танным в статье набором при- знаков 0.524 Twitter Spammer Detection Using Data Stream Clustering [26] Алгоритм кластеризации DenStream 0.370 A generic statistical approach for spam detection in online social networks [10] Марковский алгоритм класте- ризации 0.923 DNA-inspired online behavioral mod- eling and its application to spambot detection [27] Сравнение «цифровой ДНК» аккаунтов 0.923 Распознавание ботов в онлайновых социальных сетях при помощи ал- горитма «Случайный лес» «Случайный лес» с 9 призна- ками аккаунтов 0.963 Как видно, обученный в данной статье алгоритм является довольно эффективным по сравнению с другими работами. 5 В статье используются различные алгоритмы машинного обучения, основная цель статьи была пока- зать эффективность разработанных признаков. Однако наиболее хорошие результаты показал алгоритм «Случайный лес» Машиностроение и компьютерные технологии 35 Заключение Для распознавания ботов в онлайновой социальной сети Twitter был использован ал- горитм машинного обучения «Случайный лес». В качестве исходных данных для обуче- ния и тестирования алгоритма была использована база данных из нескольких тысяч акка- унтов Twitter, состоящей как из обычных пользователей, так из нескольких видов ботов. Стоит отметить, что для обучения алгоритма были использованы только 9 признаков ак- каунтов Twitter. При помощи алгоритма кросс-валидации были подобраны оптимальные гиперпараметры алгоритма, в качестве которых рассматривались число и глубина деревь- ев. На обученном алгоритме с оптимальным набором гиперпараметров было произведено тестирование на случайном наборе данных и получено значение F 1 -метрики равной 0.972. Кроме того, было произведено тестирование на двух дополнительных наборах данных для сравнения с другими работами, в результате которого были получены значения F 1 -метрик равные 0.973 и 0.963. Полученные значения являются довольно высокими по сравнению с тестами алгоритмов других авторов. Download 1.31 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling