Нейросетевое прогнозирование временных рядов овакимян А. С
Download 300.87 Kb. Pdf ko'rish
|
Paper4
x(t + d) =f (x(t), x(t -1),..., x(t -N +1)),
Обычно d берется равным единице, то есть функция f прогнозирует следующее значение x. Временной ряд представляет собой последовательность наблюдаемых значений какого-либо признака, упорядоченных в неслучайные моменты времени. Отличием анализа временных рядов от анализа случайных выборок является предположение о равных промежутках времени между наблюдениями и их хронологический порядок [1]. При решении задачи прогнозирования необходимо идентифицировать переменные, которые будут прогнозироваться, временные параметры и степень точности прогноза. Часто при решении задач прогнозирования возникает необходимость предсказания не самой переменной, а изменений ее значений. Точность прогноза, требуемая для решения конкретной задачи, оказывает большое влияние на прогнозирующую систему. Ошибка прогноза зависит от используемой системы прогноза. Чем больше ресурсов имеет такая система, тем больше шансов получить более точный прогноз. Однако прогнозирование не может полностью уничтожить риски при принятии решений. Поэтому всегда учитывается возможная ошибка прогнозирования. Точность прогноза характеризуется ошибкой прогноза. При решении задач прогнозирования аналитику приходится принять решения относительно таких характеристик временного ряда как тренд, сезонная и циклическая компоненты, делать предположения о модели временного ряда – аддитивной, мультипликативной и др. Автоматического способа обнаружения трендов во временных рядах не существует. В то же время при изучении кривой, отражающей результаты наблюдений, аналитику трудно делать предположения относительно повторяемости формы кривой через равные промежутки времени [1]. Общим недостатком статистических моделей является сложность выбора типа модели и подбора ее параметров. Все это существенно увеличивает субъективный вклад участников процесса анализа и прогнозирования ВР. Таким образом, результат анализа и прогнозирования ВР зависит как от квалификации аналитика в предметной отрасли, так и от его квалификации в методах анализа. Аппарат НС подразумевает минимальное участие аналитика в формировании модели временного ряда, так как способность нейросетевых моделей к обучению позволяет выявить скрытые взаимосвязи и закономерности между данными, а алгоритмы обучения адаптируют весовые коэффициенты в соответствии со структурой данных, представленных для обучения [2,3, 4]. Использование аппарата НС для прогнозирования ВР с заключается в формировании НС определенной структуры, в ее параметрической настройке на основе поведения исследуемой системы в заранее известные моменты времени, в предсказании будущего поведения системы по ее предыстории. Выбор структуры нейронной сети обусловливается спецификой и сложностью решаемой задачи. Для решения некоторых типов задач разработаны оптимальные конфигурации [5, 6]. Параметрическая настройка НС происходит на основе обучения сети на выделенной из множества исходных данных обучающей выборке (ОВ). При обучении с учителем для каждого обучающего входного примера требуется знание правильного ответа. Нейронной сети предъявляются значения входных и выходных сигналов, а она по определенному алгоритму подстраивает веса синаптических связей. В процессе обучения производится корректировка весов сети по результатам сравнения фактических выходных значений с известными заранее и ожидаемыми выходными значениями. При обучении НС происходит изменение весовых коэффициентов сети на основании изменения фактической погрешности на итерациях обучения. Качество обученной НС оценивается на контрольной выборке (КВ), также выделенной из множества исходных данных. ОВ и КВ не непересекаются и, как правило, в множестве исходных данных хронологически следуют друг за другом. Если на КВ значение ошибки находится в допустимых пределах, то настройка НС считается завершенной, а нейронная сеть готовой для решения задачи прогнозирования. При построении модели прогнозирования часто приходится выполнять некоторое предварительное преобразование данных с целью удовлетворения ряду известных требований. Это касается как прогнозируемой величины (ПВ), так и обучающей и контрольной выборок. Основное требование к ПВ заключается в том, чтобы было возможно прогнозировать будущие значения временного ряда. Как правило, в зависимости от задачи, приходится прибегать к таким методам по преобразованию входных данных, которые позволяют правильно судить о закономерностях и особенностях в данных, отражающих их качественные характеристики. Часто встает задача отображения данных в пространство меньшей размерности. Такая свертка данных приводит к устранению избыточности в данных и сокращению времени обучения НС. Одним из главных требований в временному ряду является его стационарность, состоящая в том, что распределение его значений является инвариантным относительно момента времени, для которого оно построено. Для характеристики стационарности используется то, что для двух выборок, построенных в разные моменты времени, закон распределения должен оставаться тем же. Если элемент рассматриваемых временных рядов многомерен, следует анализировать каждый компонент x i элемента временного ряда и проверить, что он имеет равномерное распределение на отрезке [m i - σ i , m i + σ i, ], где m i - математическое ожидание признака x i , σ i – ее дисперсия [5,6]. Важной предпосылкой для правильного восстановления интерполируемой функции нейронной сетью является то, чтобы наборы, входящие в ОВ и КВ не противоречили друг другу. Это означает, что для двух близких векторов выборки значения прогнозируемой величины также близки. На практике применяется подход, состоящий в том, что два вектора считаются близкими, если один находится в некоторой окрестности другого. Границы окрестности выбирают так, чтобы условие имело место для 50-100% наборов из ОВ или КВ. Таким образом, для обеспечения качества построенной нейронной сети следует соответствующим образом выбрать как данные для обучения, так и данные для ее оценки . От обучающей выборки зависит также время, требуемое для обучения сети. Обучающая выборка должна быть представительной. Существуют разные эвристики по выбору “скользящего окна”, обозревающего участок временного ряда, используемый как вход нейронной сети [5,6]. Поскольку нейронная сеть работает только с числовыми входными данными, важным этапом при подготовке данных является преобразование и кодирование данных. Данные, предназначенные для обучения, должны быть нормализованы и их значения должны быть распределены в определенном диапазоне [6]. В среде RStudio с помощью встроенных модулей поддержки механизма нейронных сетей были построены нейронные сети с разными параметрами. Эксперименты были проведены с использованием временного ряда, содержашего историческую информацию о землетрясениях в разных регионах земного шара за период с 01.01.1990г. по 31.10.2007г. Ряд содержит данные о координатах региона, глубине эпицентра и магнитуде землетрясения. Ряд изучен на удовлетворение условию стационарности, обучающая и контрольная выборки проверены на соответствие критериям качества. На рис. 1 изображена обученная нейронная сеть, где использованы данные о координатах региона, глубине эпицентра и магнитуды землетрясения. Рис. 1. Обученная нейронная сеть. Качество обученной сети оценено по результатам ее работы на контрольной выборке (рис. 2). Степень близости графиков свидетельствует об удовлетворительной настройке сети. Рис.8 Результат работы НС на контрольной выборке. С помощью построенных нейронных сетей было проведено прогнозирование магнитуды и глубины эпицентра землетрясения в разных регионах. Сравнительный анализ реальных данных и результатов, полученных с помощью встроенных в среду RStudio стандартных методов прогнозирования и с помощью нейронных сетей, свидетельствует о том, что метод нейросетевого прогнозирования может беспроигрышно конкурировать со стандартными статистическими методами прогнозирования. Download 300.87 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling