Методы интеллектуального анализа данных


Data Mining как мультидисциплинарная система


Download 183.72 Kb.
bet7/7
Sana24.12.2022
Hajmi183.72 Kb.
#1057603
1   2   3   4   5   6   7
Bog'liq
Методы интеллектуального анализа данных

Data Mining как мультидисциплинарная система
Ключевое достоинство «Data Mining» по сравнению с предшествующими методами — возможность автоматического порождения гипотез о взаимосвязи между различными параметрами или компонентами данных. Работа аналитика при работе с традиционным пакетом обработки данных сводится фактически к проверке или уточнению одной-двух порожденных им самим гипотез.
Еще одна важная особенность систем Data Mining возможность обработки многомерных запросов и поиска многомерных зависимостей. Системы Data-mining способны автоматически обнаруживать исключительные ситуации, т.е. элементы данных, «выпадающие» из общих закономерностей.
Выделяют пять стандартных типов закономерностей, которые позволяют выявлять методы «Data Minin»1: ассоциация; последовательность; классификация; кластеризация; прогнозирование.
Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборки и виде распределений значений анализируемых показателей. «Data Mining» является мультидисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. (рис. 7.1).
В настоящее время для решения задач «Data Mining» используются нейросетевые технологии, статистические пакеты SAS, SPSS, STATISTICA, STATGRAPHICS и др. В процессе работы с нерегламентированными запросами аналитик точно знает, на какие вопросы клиент хотел бы получить ответы, и просто извлекает нужную информацию из куба OLAP. Например, сотрудник налоговой службы мог бы спросить: «Какова тенденция роста уклонения от налогов доходов и прибыли в нефтеперерабатывающей отрасли (производство бензина) за последние два квартала текущего года?»
С помощью методов «Data-Mining» при отсутствии априорной информации об объектах и их поведении и значительной ее неполноте решаются следующие задачи:

  • выделение в данных групп, сходных по некоторым признакам записей;

  • нахождение и аппроксимация зависимостей, связывающих анализируемые параметры или события;

  • поиск наиболее значимых параметров в данной проблеме (задаче);

  • выявление данных, характеризующих значительные или существенные отклонения от сложившихся ранее закономерностей (анализ отклонений);

  • прогнозирование развития объектов, систем, процессов на основе хранящейся ретроспективной информации или с использованием принципов обучения на известных примерах и другие задачи.

Download 183.72 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling