Основы информационных технологий


§3.2. Инструментальные средства анализа данных


Download 1.75 Mb.
Pdf ko'rish
bet41/49
Sana15.12.2022
Hajmi1.75 Mb.
#1008307
TuriУчебное пособие
1   ...   37   38   39   40   41   42   43   44   ...   49
Bog'liq
Интеллектуальный анализ данных Чернышова

§3.2. Инструментальные средства анализа данных 
Инструменты Data Mining во многих случаях рассматриваются как со-
ставная часть BI-платформ, в состав которых также входят средства по-
строения хранилищ и витрин данных, средства обработки неожиданных 
запросов (ad-hoc query), средства отчетности (reporting), а также ин-
струменты OLAP. 


– 79 – 
Разработкой в секторе Data Mining всемирного рынка программного 
обеспечения заняты как всемирно известные лидеры, так и новые разви-
вающиеся компании. Инструменты Data Mining могут быть представлены 
либо как самостоятельное приложение, либо как дополнения к основно-
му продукту. 
Последний вариант реализуется многими лидерами рынка про-
граммного обеспечения. Так, уже стало традицией, что разработчики 
универсальных статистических пакетов в дополнение к традиционным 
методам статистического анализа включают в пакет определенный 
набор методов Data Mining. Это такие программные решения, как SPSS 
(IBM), Statistica (StatSoft), SAS Business Analytics Framework (SAS Insti-
tute). Некоторые разработчики OLAP-решений также предлагают набор 
методов Data Mining, например семейство продуктов Cognos (IBM). Есть 
поставщики, включающие Data Mining-решения в функциональность 
СУБД: это Microsoft (Microsoft SQL Server), Oracle, IBM (IBM Intelligent 
Miner for Data). 
Инструменты Data Mining можно оценивать по различным критериям. 
Оценка программных средств Data Mining с точки зрения конечного 
пользователя определяется путем оценки набора его характеристик. Их 
можно поделить на две группы: бизнес-характеристики и технические 
характеристики. 
Рассмотрим некоторые из подобных характеристик: 
- интуитивный интерфейс; 
- удобство экспорта/импорта данных; 
- наглядность и разнообразие получаемой отчетности; 
- легкость обучения работе с инструментарием; 
- удобство и простота использования; 
- наличие русифицированной версии инструмента; 
- наличие демонстрационной версии; 
- возможности визуализации; 
- количество реализуемых методов и алгоритмов; 
- скорость вычислений и скорость представления результатов; 
- возможности поиска, сортировки, фильтрации; 
- платформы, на которых поддерживается работа инструмента. 
Приведенные характеристики являются критериями функционально-
сти, удобства, безопасности инструмента Data Mining. При выборе ин-
струмента следует руководствоваться потребностями, а также задачами, 
которые необходимо решить. 


– 80 – 
Например, если точно известно, что фирме необходимо решать ис-
ключительно задачи классификации, то возможность решения инстру-
ментом других задач совсем не является критичной. Однако следует 
учитывать, что внедрение Data Mining при серьезном подходе требует 
серьезных финансовых вложений, поэтому необходимо учитывать все 
возможные задачи, которые могут возникнуть в перспективе. 
Рынок инструментов Data Mining определяется широтой этой техноло-
гии и огромным многообразием программного обеспечения. Выделяются 
инструменты общего и специфического назначения; бесплатные и ком-
мерческие инструменты. 
Наиболее популярная группа инструментов содержит следующие ка-
тегории: 
- наборы инструментов;
- классификация данных;
- кластеризация и сегментация;
- инструменты статистического анализа;
- анализ текстов (Text Mining), извлечение отклонений (Information 
Retrieval (IR));
- инструменты визуализации. 
К категории наборов инструментов относятся универсальные сред-
ства, которые включают методы классификации, кластеризации и пред-
варительной подготовки данных. К этой группе относятся такие извест-
ные коммерческие инструменты, как: 
- IBM Intelligent Miner for Data; инструмент предлагает последние Data 
Mining-методы, поддерживает полный Data Mining-процесс – от подготовки 
данных до презентации результатов; поддержка языков XML и PMML; 
- Oracle Data Mining; инструмент обеспечивает GUI, PL/SQL-интер-
фейсы, Java-интерфейс; используемые методы: байесовская классифика-
ция, алгоритмы поиска ассоциативных правил, кластерные методы, SVM и 
другие; 
- SAS Enterprise Miner; интегрированный набор, который обеспечива-
ет дружественный GUI; поддерживается методология SEMMA; 
- SPSS; один из наиболее популярных инструментов, поддерживает-
ся множество методов Data Mining; 
- Statistica Data Miner; инструмент обеспечивает всесторонний, инте-
грированный статистический анализ данных, имеет мощные графические 
возможности, управление базами данных, а также приложение разра-
ботки систем; 
- Polyanalyst; набор, обеспечивающий всесторонний Data Mining. 


– 81 – 
Вторая группа задач представлена инструментами, реализующими 
следующие решения: 
- инструментарий для поиска ассоциативных правил;
- агенты;
- оценивание, регрессии и прогнозирование;
- анализ связей;
- последовательные шаблоны и временные ряды;
- инструменты BI (Business Intelligence), Database and OLAP software;
- инструменты преобразования и очистки данных;
- библиотеки, компоненты и инструментальные наборы для разра-
ботчиков создания встроенных приложений Data Mining;
- Web Mining: анализ поведения сайтов, XML mining;
- поиск на Web;
- Audio and Video Mining.

Download 1.75 Mb.

Do'stlaringiz bilan baham:
1   ...   37   38   39   40   41   42   43   44   ...   49




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling