Учебное пособие Москва • Санкт-Петербург 2013 А94 ббк 32. 973 А94
Download 113.08 Kb. Pdf ko'rish
|
afanasieva
- Bu sahifa navigatsiya:
- 1.4. построение моделей
- Прежде чем построить модель, необходимо случайным образом разделить подготовленные данные в отдельные наборы обуча ющих и контрольных данных.
1.3. просмотр данных
Третьим шагом процесса интеллектуального анализа данных является просмотр подготовленных данных. Для принятия правильных решений при создании моделей не- обходимо понимать данные. Методы исследования данных включают в себя расчет мини мальных и максимальных значений, расчет средних и стандарт ных отклонений и изучение распределения данных. После исследования данных можно определить, содержит ли набор данных дефектные данные или нет, а затем разработать стратегию по устранению несоответствий. Конструктор представлений источников данных в среде BI Development Studio содержит несколько средств, которые мож- но использовать для просмотра данных. 1.4. построение моделей Четвертым шагом процесса интеллектуального анализа дан- ных является построение моделей интеллектуального анализа данных. Прежде чем построить модель, необходимо случайным образом разделить подготовленные данные в отдельные наборы обуча ющих и контрольных данных. Набор обучающих данных используется для построения моде- ли, а контрольный набор данных — для проверки точности модели 13 Глава 1. Основные понятия интеллектуального анализа данных путем создания прогнозирующих запросов. Чтобы разделить набор данных, можно использовать Преобразование «Процентная вы- борка» в службах Integration Services. Знания, полученные при выполнении шага 3 «Просмотр данных», помогут определить и создать модель интеллектуального анализа дан- ных. Обычно модель содержит входные столбцы, идентифицирующий столбец и прогнозируемый столбец. Данные столбцы можно затем определить в новой модели при помощи языка расширений интел- лектуального анализа данных или мастера интеллектуального анали- за данных в среде BI Development Studio. После определения структуры модели интеллектуального ана- лиза данных выполняется ее обработка и наполнение пустой структуры шаблонами, описывающими модель. Данный процесс известен как обучение модели. Шаблоны выявляются путем при- менения в отношении исходных данных математического алго- ритма. SQL Server 2005 содержит отдельный алгоритм для каждо- го типа модели, доступной для построения. Для настройки каждо- го алгоритма можно использовать параметры. Модель интеллектуального анализа данных определяется объ- ектом структуры интеллектуального анализа данных, объектом модели интеллектуального анализа данных и алгоритмом интел- лектуального анализа данных. Службы Microsoft SQL Server 2005 Analysis Services (SSAS) со- держат следующие алгоритмы: • алгоритм дерева принятия решений (Microsoft); • алгоритм кластеризации (Microsoft); • упрощенный алгоритм Байеса (Microsoft); • алгоритм взаимосвязей (Microsoft); • алгоритм кластеризации последовательностей (Microsoft); • алгоритм временных рядов (Microsoft); • алгоритм нейронной сети (Microsoft) (службы SSAS); • алгоритм логистической регрессии (Microsoft); • алгоритм линейной регрессии (Microsoft). Download 113.08 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling