Методические указания к лабораторным занятиям Интеллектуальные системы обработки информации и машинное обучение Ставрополь, 2017


Download 4.3 Mb.
Pdf ko'rish
bet53/121
Sana27.10.2023
Hajmi4.3 Mb.
#1727451
TuriМетодические указания
1   ...   49   50   51   52   53   54   55   56   ...   121
Bog'liq
78Metod IntelectSysObrInf 10.05.03 12.02.2017

3 этап. Трансформация данных. Этот шаг необходим для тех 
методов, которые требуют, чтобы исходные данные были в каком-то 
определенном виде. Дело в том, что различные алгоритмы анализа 
требуют специальным образом подготовленные данные. Например
для прогнозирования необходимо преобразовать временной ряд при 
помощи 
скользящего 
окна 
или 
вычисление 
агрегируемых 
показателей. К задачам трансформации данных относятся: скользящее 
окно, приведение типов, выделение временных интервалов
преобразование непрерывных значений в дискретные и наоборот, 
сортировка, группировка и прочее. 
 
4 этап. Data Mining. На этом этапе строятся модели, в которых 
применяются различные алгоритмы для нахождения знаний. Это 
нейронные сети, деревья решений, алгоритмы кластеризации и 
установления ассоциаций и т.д. 
 

этап. Интерпретация. На данном этапе осуществляется 
применение пользователем полученных моделей (знаний) в бизнес 
приложениях. Для оценки качества полученной модели нужно 
использовать как формальные методы, так и знания аналитика. 
Именно аналитик может сказать, насколько применима полученная 
модель к реальным данным. 
Пример. Имеется сеть магазинов розничной торговли. 
Требуется получить прогноз объемов продаж на следующий месяц. 
Первым шагом будет сбор истории продаж в каждом магазине и 
объединение ее в общую выборку данных. Следующим шагом будет 
предобработка собранных данных: 
12



их группировка по месяцам, сглаживание кривой продаж, устранение 
факторов, слабо влияющих на объемы продаж. Далее следует 
построить модель зависимости объемов продаж от выбранных 
факторов. Это можно сделать с помощью линейной регрессии или 
нейронных сетей. Имея такую модель, можно получить прогноз, 
подав на вход модели историю продаж. Зная прогнозное значение, его 
можно использовать, например, в приложениях оптимизации для 
лучшего размещения товара на складе. 
Полученные модели являются, по сути, формализованными 
знаниями эксперта, а следовательно, их можно тиражировать. В этом 
заключается самое главное преимущество KDD. Т.е. построенную 
одним человеком модель могут применять другие, без необходимости 
понимания методик, при помощи которой эти модели построены. 
Найденные знания должны быть использованы на новых данных с 
некоторой степенью достоверности. 

Download 4.3 Mb.

Do'stlaringiz bilan baham:
1   ...   49   50   51   52   53   54   55   56   ...   121




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling