Представлена в редакцию


 Результаты обучения и тестирования


Download 1.31 Mb.
Pdf ko'rish
bet7/13
Sana19.06.2023
Hajmi1.31 Mb.
#1603028
1   2   3   4   5   6   7   8   9   10   ...   13
Bog'liq
raspoznavanie-botov-v-onlaynovyh-sotsialnyh-setyah-pri-pomoschi-algoritma-sluchaynyy-les

4. Результаты обучения и тестирования 
В данном разделе представлены результаты обучения алгоритма «Случайный лес» с 
подбором оптимальных гиперпараметров при помощи метода кросс-валидации по 10 бло-
кам, где в качестве метрики для оценки точности используется
мера. Данные были раз-
делены методом стратификации на две группы: тренировочные и тестовые (90% трениро-
вочных, 10% тестовых). На тренировочных данных происходит подбор оптимальных ги-
перпараметров, а на тестовых вычисляется значение точности модели, использующей эти 
гиперпараметры. 
Программное обеспечение, с помощью которого были реализованы описанные дей-
ствия, написано на языке программирования высокого уровня Python с использованием 
набора библиотек Python. Из используемых библиотек особенно стоит упомянуть библио-
теку машинного обучения scikit-learn [24], которая позволила выполнить поставленные 
задачи. Реализованная модель для распознавания ботов в онлайновой социальной сети 


Машиностроение и компьютерные технологии
 
33 
Twitter была выложена в сеть Интернет и доступна по URL-адресу: https://bot-
detect.herokuapp.com.В таблице Таблица 3 представлена зависимость
метрики от коли-
чества решающих деревьев и от максимальной глубины деревьев на тренировочных 
данных. 
Таблица 3. Зависимость значения метрики
от гиперпараметров при использовании метода кросс-
валидации 









 
 

0.761 
0.760 
0.813 
0.963 
0.950 
0.950 
0.955 
0.958 
0.958 

0.959 
0.957 
0.960 
0.961 
0.964 
0.965 
0.963 
0.959 
0.953 

0.761 
0.899 
0.953 
0.963 
0.965 
0.969 
0.967 
0.968 
0.969 

0.962 
0.963 
0.961 
0.963 
0.966 
0.969 
0.968 
0.968 
0.970 

0.780 
0.950 
0.955 
0.965 
0.967 
0.969 
0.970 
0.970 
0.971 

0.898 
0.944 
0.961 
0.964 
0.967 
0.970 
0.969 
0.970 
0.971 

0.956 
0.956 
0.962 
0.965 
0.967 
0.970 
0.969 
0.971 
0.971 

0.904 
0.957 
0.964 
0.965 
0.967 
0.971 
0.970 
0.972 
0.972 

0.775 
0.961 
0.963 
0.965 
0.968 
0.970 
0.971 
0.973 
0.972 
Как видно, наилучшие результаты достигаются при глубине дерева равном 8 и 
числе решающих деревьев равном 9. После обучения алгоритма на тренировочных дан-
ных с полученными оптимальными гиперпараметрами было произведено тестирование на 
тестовых данных и получено значение
метрики равное 0.972. 

Download 1.31 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   ...   13




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling