Учебное пособие Москва • Санкт-Петербург 2013 А94 ббк 32. 973 А94
Download 113.08 Kb. Pdf ko'rish
|
afanasieva
• шаблонов Data Mining для Visio, которые предоставляют возможность графического отображения, форматирова- ния, описания и распространения результатов моделиро- вания Data Mining в виде диаграмм. Далее познакомимся с этими компонентами подробнее. В пособии используется термин «SQL Server 2005», или «SQL Server», но все рассматриваемые возможности существуют и в версии «SQL Server 2008». Все, что далее описано, относится к версиям Microsoft SQL Server 2005 (или выше) и Microsoft Excel 2007 (или выше). Все алгоритмы Analysis Services, рассмотренные далее, реали- зованы фирмой Microsoft; особенности использования аналогич- ных алгоритмов других фирм (например, Oracle) здесь не рассма- триваются. Практические задания по темам находятся в сетевом каталоге преподавателя. 9 глАВА 1. ОСнОВные пОняТия инТеллеКТуАльнОгО АнАлизА дАнных Интеллектуальный анализ данных часто описывается как про- цесс извлечения допустимых, достоверных данных, а также данных с быстрым доступом из крупных баз данных. Другими словами, ин- теллектуальный анализ извлекает шаблоны и тренды, существую- щие в данных. Такие шаблоны и тренды могут быть собраны воеди- но и определены как модель интеллектуального анализа данных. Модели интеллектуального анализа данных могут применяться к конкретным бизнес-сценариям, например: • прогнозирование продаж; • почтовая рассылка определенным клиентам; • определение продуктов, которые с высокой долей веро- ятности могут быть проданы вместе; • выявление последовательностей в том порядке, в кото- ром клиенты добавляют продукты в корзину для покупок. Нужно понимать, что построение модели интеллектуального анализа данных является составной частью более масштабного процесса, начинающегося с определения базовой проблемы, ко- торую модель будет решать, и заканчивающегося развертыванием этой модели в рабочей среде. Данный процесс может быть задан при помощи следующих шести базовых шагов: 1. Постановка задачи. 2. Подготовка данных. 3. Просмотр данных. 4. Построение моделей. 5. Исследование и проверка моделей. 6. Развертывание и обновление моделей. На следующей диаграмме (рис. 1) представлены связи между всеми шагами процесса и технологии Microsoft SQL Server 2005, которые можно использовать для выполнения каждого шага. 10 С.В. А фАнАСьеВА . Т ехнология инТеллекТуАльного АнАлизА дАнных Хотя представленный процесс носит циклический характер, каждый шаг не обязательно ведет напрямую к следующему шагу. Создание модели интеллектуального анализа данных представля- ет собой динамический итеративный процесс. Выполнив обзор данных, пользователь может обнаружить, что существующих дан- ных недостаточно для создания требуемых моделей интеллекту- ального анализа данных, что, соответственно, ведет к необходи- мости поиска дополнительных данных. Можно разработать не- сколько моделей и понять, что они не решают сформулированной задачи. Следовательно, требуется изменение характеристик зада- чи. Таким образом, важно понимать, что создание модели интел- лектуального анализа данных является процессом и что каждый шаг такого процесса может быть повторен столько раз, сколько необходимо для создания эффективной модели. SQL Server 2005 представляет интегрированную среду для со- здания и работы с моделями интеллектуального анализа данных, известную как среда Business Intelligence Development Studio. Дан- ная среда включает алгоритмы интеллектуального анализа дан- ных и средства, облегчающие разработку исчерпывающего реше- ния, применимого в рамках самых разных проектов. Рис. 1. Диаграмма связей процессов |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling