Представлена в редакцию
Результаты обучения и тестирования
Download 1.31 Mb. Pdf ko'rish
|
raspoznavanie-botov-v-onlaynovyh-sotsialnyh-setyah-pri-pomoschi-algoritma-sluchaynyy-les
- Bu sahifa navigatsiya:
- Таблица 3
4. Результаты обучения и тестирования
В данном разделе представлены результаты обучения алгоритма «Случайный лес» с подбором оптимальных гиперпараметров при помощи метода кросс-валидации по 10 бло- кам, где в качестве метрики для оценки точности используется мера. Данные были раз- делены методом стратификации на две группы: тренировочные и тестовые (90% трениро- вочных, 10% тестовых). На тренировочных данных происходит подбор оптимальных ги- перпараметров, а на тестовых вычисляется значение точности модели, использующей эти гиперпараметры. Программное обеспечение, с помощью которого были реализованы описанные дей- ствия, написано на языке программирования высокого уровня Python с использованием набора библиотек Python. Из используемых библиотек особенно стоит упомянуть библио- теку машинного обучения scikit-learn [24], которая позволила выполнить поставленные задачи. Реализованная модель для распознавания ботов в онлайновой социальной сети Машиностроение и компьютерные технологии 33 Twitter была выложена в сеть Интернет и доступна по URL-адресу: https://bot- detect.herokuapp.com.В таблице Таблица 3 представлена зависимость метрики от коли- чества решающих деревьев и от максимальной глубины деревьев на тренировочных данных. Таблица 3. Зависимость значения метрики от гиперпараметров при использовании метода кросс- валидации 1 2 3 4 5 6 7 8 9 1 0.761 0.760 0.813 0.963 0.950 0.950 0.955 0.958 0.958 2 0.959 0.957 0.960 0.961 0.964 0.965 0.963 0.959 0.953 3 0.761 0.899 0.953 0.963 0.965 0.969 0.967 0.968 0.969 4 0.962 0.963 0.961 0.963 0.966 0.969 0.968 0.968 0.970 5 0.780 0.950 0.955 0.965 0.967 0.969 0.970 0.970 0.971 6 0.898 0.944 0.961 0.964 0.967 0.970 0.969 0.970 0.971 7 0.956 0.956 0.962 0.965 0.967 0.970 0.969 0.971 0.971 8 0.904 0.957 0.964 0.965 0.967 0.971 0.970 0.972 0.972 9 0.775 0.961 0.963 0.965 0.968 0.970 0.971 0.973 0.972 Как видно, наилучшие результаты достигаются при глубине дерева равном 8 и числе решающих деревьев равном 9. После обучения алгоритма на тренировочных дан- ных с полученными оптимальными гиперпараметрами было произведено тестирование на тестовых данных и получено значение метрики равное 0.972. Download 1.31 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling