Учебное пособие Москва • Санкт-Петербург 2013 А94 ббк 32. 973 А94


Download 113.08 Kb.
Pdf ko'rish
bet7/11
Sana04.11.2023
Hajmi113.08 Kb.
#1746135
TuriУчебное пособие
1   2   3   4   5   6   7   8   9   10   11
Bog'liq
afanasieva

1.3. просмотр данных 
Третьим шагом процесса интеллектуального анализа данных 
является просмотр подготовленных данных. 
Для принятия правильных решений при создании моделей не-
обходимо понимать данные. 
Методы исследования данных включают в себя расчет мини­
мальных и максимальных значений, расчет средних и стандарт­
ных отклонений и изучение распределения данных. 
После исследования данных можно определить, содержит ли 
набор данных дефектные данные или нет, а затем разработать 
стратегию по устранению несоответствий. 
Конструктор представлений источников данных в среде
BI Development Studio содержит несколько средств, которые мож-
но использовать для просмотра данных.
1.4. построение моделей 
Четвертым шагом процесса интеллектуального анализа дан-
ных является построение моделей интеллектуального анализа 
данных. 
Прежде чем построить модель, необходимо случайным образом 
разделить подготовленные данные в отдельные наборы обуча­
ющих и контрольных данных. 
Набор обучающих данных используется для построения моде-
ли, а контрольный набор данных — для проверки точности модели 


13
Глава 1. Основные понятия интеллектуального анализа данных
путем создания прогнозирующих запросов. Чтобы разделить набор 
данных, можно использовать Преобразование «Процентная вы-
борка» в службах Integration Services.
Знания, полученные при выполнении шага 3 «Просмотр данных», 
помогут определить и создать модель интеллектуального анализа дан-
ных. Обычно модель содержит входные столбцы, идентифицирующий 
столбец и прогнозируемый столбец. Данные столбцы можно затем 
определить в новой модели при помощи языка расширений интел-
лектуального анализа данных или мастера интеллектуального анали-
за данных в среде BI Development Studio. 
После определения структуры модели интеллектуального ана-
лиза данных выполняется ее обработка и наполнение пустой 
структуры шаблонами, описывающими модель. Данный процесс 
известен как обучение модели. Шаблоны выявляются путем при-
менения в отношении исходных данных математического алго-
ритма. SQL Server 2005 содержит отдельный алгоритм для каждо-
го типа модели, доступной для построения. Для настройки каждо-
го алгоритма можно использовать параметры. 
Модель интеллектуального анализа данных определяется объ-
ектом структуры интеллектуального анализа данных, объектом 
модели интеллектуального анализа данных и алгоритмом интел-
лектуального анализа данных.
Службы Microsoft SQL Server 2005 Analysis Services (SSAS) со-
держат следующие алгоритмы:
• алгоритм дерева принятия решений (Microsoft);
• алгоритм кластеризации (Microsoft);
• упрощенный алгоритм Байеса (Microsoft);
• алгоритм взаимосвязей (Microsoft);
• алгоритм кластеризации последовательностей (Microsoft);
• алгоритм временных рядов (Microsoft);
• алгоритм нейронной сети (Microsoft) (службы SSAS);
• алгоритм логистической регрессии (Microsoft);
• алгоритм линейной регрессии (Microsoft).

Download 113.08 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   11




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling