Простой 8 мин 18K
Download 204.39 Kb.
|
Анализ временных рядов (2)
+8
52 11 +11 Редакторский дайджест Присылаем лучшие статьи раз в месяц Начало формы Конец формы OTUS Цифровые навыки от ведущих экспертов СайтВКонтактеTelegram 80 Карма 95.2 Рейтинг OTUS @MaxRokatansky Редактор Комментарии 11 Ritan27 апр в 19:51 Читается как реферат для универа - никакой конкретики. Если уж аналитика данных переживает настоящий бум то было бы гораздо интереснее почитать про реальные результаты, а не высосанные из пальца "примеры", которые можно придумать даже просто прочитав название. +4 Ответить adeshere27 апр в 23:25 Цель анализа временных рядов - определить закономерности в изменениях параметра во времени и сделать прогноз на будущее. Вообще-то, тут стоит еще добавить задачу поиска/изучения взаимосвязей между параметрами. В поисковых научных приложениях она обычно даже важнее, чем прогнозирование. Существует три основных метода анализа временных рядов: стационарность, автокорреляцию и спектральный анализ. Сказать по-правде, меня эта фраза просто ставит в тупик. Я уже много лет вошкаюсь с разными временными рядами, но никогда не задумывался, что стационарность - это метод анализа. Так что спасибо за свежий взгляд на вроде бы привычные вещи ;-) ...но учить такому студентов я бы все-таки не рекомендовал ;-)) А если немного серьезнее, то, как говорят медики, не бывает здоровых, - есть недообследованные. Так вот, опыт показывает, что в перечисленных Вами областях (финансы, производство, социальные и экономические исследования, климатология) даже и обследовать никого не нужно: отсутствие стационарности в подавляющем большинстве случаев очевидно еще до открытия графика.... Потому я бы тут сделал акцент на том, что свойство стационарности (а еще лучше эргодичности) - это крайне полезная, но, увы, сугубо теоретическая модель. Да, в рамках этой модели наши возможности по использованию разных схем (алгоритмов) анализа данных расширяются просто неимоверно. Только вот в практической жизни таких (удовлетворяющих этой модели) рядов не бывает... Вопрос поэтому можно ставить только в том плане, можем ли мы разделить сигнал на стационарную и нестационарную составляющую. Я пытался это делать с очень многими геофизическими рядами, и пришел к выводу, что сделать это аккуратно почти невозможно. А если делать неаккуратно - получается вот что. Кому лень лазить по ссылкам, скажу по-простому: если Вы работаете с временными рядами из перечисленных областей, и не слишком горите желанием заглубляться в методические подвалы, то про корреляционные методы анализа таких данных лучше сразу забыть. То есть, посчитать корреляции, АКФ-ВКФ и т.п. Вы, конечно же, сможете. Но вот правильно оценить значимость результатов - почти никогда. А если ошибочно принять такой статистический артефакт за устойчивый системный эффект, то можно сесть в о-о-очень глубокую лужу, и наделать таких прогнозов, за которые не увольняют с работы, а расстреливают в темном углу. В общем, как говорится, "вы молодые, шутливые и т.п...." (с), но без четкого понимания различий между случайной величиной и случайным процессом эту тему действительно "...лучше не поднимать"(с) ;-) И это уже не шутка :-(( Ну и пройдусь заодно по столь популярным в эконометрике SARIMA-подобным моделям. Да, это направление действительно стоит на плечах гигантов (Бокс, Дженкинс и др.). И к тому же имеет какую-никакую теоретическую основу, благодаря чему авторы почти любого статистического пакета АВР считают своим долгом туда все это включить. Только вот реальные ряды всегда имеют кучу неприятных свойств, начиная с пропусков и выбросов/всплесков (которые вовсе не всегда - мусор, но часто - полезный сигнал!), и кончая трендами типа случайного дрейфа с экспоненциальной поправкой. А вот к этому упомянутые модели не готовы чуть больше, чем абсолютно. Поэтому если вы просто соберете данные, и попытаетесь применить перечисленные методы "из коробки", то на выходе почти наверняка получится ерунда. Причем недостаточно искушенный аналитик даже может и не понять, что это именно ерунда. Попросту говоря, "из коробки" это все заработает лишь в особо благоприятных совершенно исключительных случаях. Да, такие тоже бывают, но если Вы только изучаете эту тему, то надо сразу же готовиться к обратному, т.е. набиванию шишек по всему телу от коленок до подзатыльника с косяками в самых разных местах. И напоследок про "Прогнозирование...". По моим представлениям, "прогнозирование" и "экстраполяция" - это почти что синонимы, если, конечно, экстраполяцию понимать в широком смысле этого слова. Я бы сказал, что прогнозирование - это поиск закономерностей в поведении сигнала или группы сигналов с последующей экстраполяцией этих закономерностей в будущее. Тут критически важны два элемента: 1) что наши закономерности реальны, т.е. статистически значимы, и что 2) они сохранятся и в будущем. А вот каким именно образом эти закономерности обнаружены - это уже совершенно другой вопрос. Пункты (1) и (2) остаются принципиальными в любом варианте. И сказать об этом гораздо важнее, чем выдернуть откуда-то три случайно подвернувшихся под руку метода (скользящего среднего, экспоненциальное сглаживание и метод Хольта-Винтерса) и подать их в таком стиле, как будто этот список близок к исчерпывающему О разделах "Преимущества и недостатки" и "Заключение", если позволите, я свое мнение придержу при себе. Но если Вы хотели прорекламировать какое-то мероприятие, то я бы все-таки посоветовал выбирать для статьи более близкую и изученную Вами тему. Иначе получается не реклама, а скорее наоборот. Глядя на столь поверхностную статью, многие могут подумать, что и рекомендуемый вебинар будет такого же уровня :-(( Download 204.39 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling