Методы интеллектуального анализа данных
Data Mining как мультидисциплинарная система
Download 183.72 Kb.
|
Методы интеллектуального анализа данных
Data Mining как мультидисциплинарная система
Ключевое достоинство «Data Mining» по сравнению с предшествующими методами — возможность автоматического порождения гипотез о взаимосвязи между различными параметрами или компонентами данных. Работа аналитика при работе с традиционным пакетом обработки данных сводится фактически к проверке или уточнению одной-двух порожденных им самим гипотез. Еще одна важная особенность систем Data Mining возможность обработки многомерных запросов и поиска многомерных зависимостей. Системы Data-mining способны автоматически обнаруживать исключительные ситуации, т.е. элементы данных, «выпадающие» из общих закономерностей. Выделяют пять стандартных типов закономерностей, которые позволяют выявлять методы «Data Minin»1: ассоциация; последовательность; классификация; кластеризация; прогнозирование. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборки и виде распределений значений анализируемых показателей. «Data Mining» является мультидисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. (рис. 7.1). В настоящее время для решения задач «Data Mining» используются нейросетевые технологии, статистические пакеты SAS, SPSS, STATISTICA, STATGRAPHICS и др. В процессе работы с нерегламентированными запросами аналитик точно знает, на какие вопросы клиент хотел бы получить ответы, и просто извлекает нужную информацию из куба OLAP. Например, сотрудник налоговой службы мог бы спросить: «Какова тенденция роста уклонения от налогов доходов и прибыли в нефтеперерабатывающей отрасли (производство бензина) за последние два квартала текущего года?» С помощью методов «Data-Mining» при отсутствии априорной информации об объектах и их поведении и значительной ее неполноте решаются следующие задачи: выделение в данных групп, сходных по некоторым признакам записей; нахождение и аппроксимация зависимостей, связывающих анализируемые параметры или события; поиск наиболее значимых параметров в данной проблеме (задаче); выявление данных, характеризующих значительные или существенные отклонения от сложившихся ранее закономерностей (анализ отклонений); прогнозирование развития объектов, систем, процессов на основе хранящейся ретроспективной информации или с использованием принципов обучения на известных примерах и другие задачи. Download 183.72 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling