Методические указания к лабораторным занятиям Интеллектуальные системы обработки информации и машинное обучение Ставрополь, 2017


 DataMining в задачах прогнозирования


Download 4.3 Mb.
Pdf ko'rish
bet116/121
Sana27.10.2023
Hajmi4.3 Mb.
#1727451
TuriМетодические указания
1   ...   113   114   115   116   117   118   119   120   121
Bog'liq
78Metod IntelectSysObrInf 10.05.03 12.02.2017

1. DataMining в задачах прогнозирования. 
Для решения задач регрессии, одной из которых является задача 
прогнозирования, 
в 
Deductor 
используются 
различные 
обработчики[4]. 
Обработчик 
«Автокорреляция». 
Целью 
автокорреляционного 
анализа 
является 
выяснение 
степени 
статистической зависимости между различными значениями 
(отсчетами) случайной последовательности, которую образует поле 
выборки данных. В процессе автокорреляционного анализа 
рассчитываются 
коэффициенты 
корреляции 
(мера 
взаимной 
зависимости) для двух значений выборки, отстоящих друг от друга на 
определенное количество отсчетов, называемые также лагом. 
Применительно к анализу временных рядов автокорреляция 
позволяет выделить месячную и годовую сезонность в данных (рис.1). 
Видно, что пик зависимости на данных приходится на 12 месяц, что 
свидетельствует о годовой сезонности. Поэтому величину продаж 
годовой давности необходимо обязательно учитывать при построении 
модели (если используется нейронная сеть – то подавать на вход). 
28



Рис. 1. Автокорреляция. 
Обработчик 
«Парциальная 
предобработка». 
Данный 
обработчик позволяет удалить аномалии и шумы в исходных данных. 
Шумы в данных (в данном случае временной ряд истории продаж) не 
только скрывают общую тенденцию, но и проявляют себя при 
построении модели прогноза. Из-за них модель может получиться 
плохого качества. Аналогичная ситуация с аномалиями, т.е. резкими 
отклонениями величины от ее ожидаемого значения. 
Однако следует понимать, что решение о сглаживании, удалении 
шумов и аномалий целиком зависит от специфики решаемой задачи
бизнес-правил предметной области и т.д. Аномалии, или случайные 
всплески в отгрузке товаров могут быть вызваны такими факторами, 
как задержка транспорта в пути и другими форс-мажорами. В любом 
случае, необходимо строить несколько моделей. 
В обработчике «Парциальная обработка» предусмотрен выбор 
степени подавления аномалий и вычитания шумов: малая, средняя, 
большая. Кроме того, в обработчике предусмотрена возможность 
заполнения пропусков, а также сглаживание данных, в том числе 
вейвлет-преобразованием. 
287 


Выбор того или иного алгоритма определяется спецификой 
конкретной задачи. 
На рис.2. приведен пример временного ряда после удаления 
аномалий и шумов. 
Рис. 2. Исходные и сглаженные данные. 

Download 4.3 Mb.

Do'stlaringiz bilan baham:
1   ...   113   114   115   116   117   118   119   120   121




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling