Основы информационных технологий
§3.2. Инструментальные средства анализа данных
Download 1.75 Mb. Pdf ko'rish
|
Интеллектуальный анализ данных Чернышова
§3.2. Инструментальные средства анализа данных
Инструменты Data Mining во многих случаях рассматриваются как со- ставная часть BI-платформ, в состав которых также входят средства по- строения хранилищ и витрин данных, средства обработки неожиданных запросов (ad-hoc query), средства отчетности (reporting), а также ин- струменты OLAP. – 79 – Разработкой в секторе Data Mining всемирного рынка программного обеспечения заняты как всемирно известные лидеры, так и новые разви- вающиеся компании. Инструменты Data Mining могут быть представлены либо как самостоятельное приложение, либо как дополнения к основно- му продукту. Последний вариант реализуется многими лидерами рынка про- граммного обеспечения. Так, уже стало традицией, что разработчики универсальных статистических пакетов в дополнение к традиционным методам статистического анализа включают в пакет определенный набор методов Data Mining. Это такие программные решения, как SPSS (IBM), Statistica (StatSoft), SAS Business Analytics Framework (SAS Insti- tute). Некоторые разработчики OLAP-решений также предлагают набор методов Data Mining, например семейство продуктов Cognos (IBM). Есть поставщики, включающие Data Mining-решения в функциональность СУБД: это Microsoft (Microsoft SQL Server), Oracle, IBM (IBM Intelligent Miner for Data). Инструменты Data Mining можно оценивать по различным критериям. Оценка программных средств Data Mining с точки зрения конечного пользователя определяется путем оценки набора его характеристик. Их можно поделить на две группы: бизнес-характеристики и технические характеристики. Рассмотрим некоторые из подобных характеристик: - интуитивный интерфейс; - удобство экспорта/импорта данных; - наглядность и разнообразие получаемой отчетности; - легкость обучения работе с инструментарием; - удобство и простота использования; - наличие русифицированной версии инструмента; - наличие демонстрационной версии; - возможности визуализации; - количество реализуемых методов и алгоритмов; - скорость вычислений и скорость представления результатов; - возможности поиска, сортировки, фильтрации; - платформы, на которых поддерживается работа инструмента. Приведенные характеристики являются критериями функционально- сти, удобства, безопасности инструмента Data Mining. При выборе ин- струмента следует руководствоваться потребностями, а также задачами, которые необходимо решить. – 80 – Например, если точно известно, что фирме необходимо решать ис- ключительно задачи классификации, то возможность решения инстру- ментом других задач совсем не является критичной. Однако следует учитывать, что внедрение Data Mining при серьезном подходе требует серьезных финансовых вложений, поэтому необходимо учитывать все возможные задачи, которые могут возникнуть в перспективе. Рынок инструментов Data Mining определяется широтой этой техноло- гии и огромным многообразием программного обеспечения. Выделяются инструменты общего и специфического назначения; бесплатные и ком- мерческие инструменты. Наиболее популярная группа инструментов содержит следующие ка- тегории: - наборы инструментов; - классификация данных; - кластеризация и сегментация; - инструменты статистического анализа; - анализ текстов (Text Mining), извлечение отклонений (Information Retrieval (IR)); - инструменты визуализации. К категории наборов инструментов относятся универсальные сред- ства, которые включают методы классификации, кластеризации и пред- варительной подготовки данных. К этой группе относятся такие извест- ные коммерческие инструменты, как: - IBM Intelligent Miner for Data; инструмент предлагает последние Data Mining-методы, поддерживает полный Data Mining-процесс – от подготовки данных до презентации результатов; поддержка языков XML и PMML; - Oracle Data Mining; инструмент обеспечивает GUI, PL/SQL-интер- фейсы, Java-интерфейс; используемые методы: байесовская классифика- ция, алгоритмы поиска ассоциативных правил, кластерные методы, SVM и другие; - SAS Enterprise Miner; интегрированный набор, который обеспечива- ет дружественный GUI; поддерживается методология SEMMA; - SPSS; один из наиболее популярных инструментов, поддерживает- ся множество методов Data Mining; - Statistica Data Miner; инструмент обеспечивает всесторонний, инте- грированный статистический анализ данных, имеет мощные графические возможности, управление базами данных, а также приложение разра- ботки систем; - Polyanalyst; набор, обеспечивающий всесторонний Data Mining. – 81 – Вторая группа задач представлена инструментами, реализующими следующие решения: - инструментарий для поиска ассоциативных правил; - агенты; - оценивание, регрессии и прогнозирование; - анализ связей; - последовательные шаблоны и временные ряды; - инструменты BI (Business Intelligence), Database and OLAP software; - инструменты преобразования и очистки данных; - библиотеки, компоненты и инструментальные наборы для разра- ботчиков создания встроенных приложений Data Mining; - Web Mining: анализ поведения сайтов, XML mining; - поиск на Web; - Audio and Video Mining. Download 1.75 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling