Представлена в редакцию


Таблица 2. Набор признаков аккаунтов, который был использован для обучения  Название признака


Download 1.31 Mb.
Pdf ko'rish
bet4/13
Sana19.06.2023
Hajmi1.31 Mb.
#1603028
1   2   3   4   5   6   7   8   9   ...   13
Bog'liq
raspoznavanie-botov-v-onlaynovyh-sotsialnyh-setyah-pri-pomoschi-algoritma-sluchaynyy-les

Таблица 2. Набор признаков аккаунтов, который был использован для обучения 
Название признака 
Описание признака 
Statuses Count 
Количество твитов, которые опубликовал аккаунт 
Followers Count 
Количество аккаунтов, которые читают твиты дан-
ного аккаунта 
Friends Count 
Количество акаунтов, на которые подписан данный 
аккаунт 
Favorites Count 
Количество твитов, которые отметил данный ака-
унт как понравившийся 
Listed Count 
Количество групп, в которых состоит данный акка-
унт 
Default Profile Image 
Указывает, загружал ли пользователь изображение 
для профиля (принимает значение 0 если загружал 
и 1 если нет) 
Geo Enabled 
Указывает, включил ли аккаунт возможность гео-
тегирования твитов (принимает значение 1 если 
включил и 0 если нет) 
Protected 
Указывает, являются ли твиты аккаунта доступны-
ми всем аккаунтам (принимает значение 0 если 
являются и 1 если нет) 
Verified 
Указывает, подтвердил ли Twitter, что данный ак-
каунт является подлинным (принимает значение 1 
если подтвердил и 0 если нет) 
3. Методика тестирования алгоритма 
3.1. Алгоритм валидации 
Главная задача алгоритмов машинного обучения – обобщить доступные данные для 
обработки новых. Для того чтобы дать оценку качества работы алгоритма на новых дан-
ных используются различные алгоритмы валидации, где все доступные данные делятся на 
тренировочные (на которых происходит обучение алгоритма) и тестовые (на которых 
происходит оценка точности алгоритма). 
В данной работе используется алгоритм кросс-валидации, который производит раз-
деление данных на тренировочные и тестовые множество раз, чтобы все экземпляры дан-
ных участвовали в оценке точности алгоритма. 
Одним из часто использующихся видов кросс-валидации является кросс-валидация 
по блокам (Рис. 1). При данном виде валидации данные делятся на блоков, после чего 
итераций происходит оценка точности. Каждую итерацию один блок берется в качестве 
тестового, а остальные блоков в качестве тренировочных. На тренировочных дан-


Машиностроение и компьютерные технологии
 
29 
ных алгоритм обучается с определёнными гиперпараметрами
4
, после чего на тестовых 
данных происходит оценка точности. Оценка точности кросс-валидацией вычисляется как 
среднее арифметическое от всех полученных ранее значений точностей. 

Download 1.31 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   13




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling