Основы информационных технологий
Download 1.75 Mb. Pdf ko'rish
|
Интеллектуальный анализ данных Чернышова
§1.4. Задачи Data Mining
Единого мнения относительно того, какие задачи следует относить к Data Mining, нет. Задачи подразделяются по типам производимой ин- формации, это наиболее общая классификация задач Data Mining: - классификация, - кластеризация, - прогнозирование, - ассоциация, - визуализация. В результате решения задачи классификации обнаруживаются при- знаки, которые характеризуют группы объектов исследуемого набора данных – классы; по этим признакам новый объект можно отнести к тому или иному классу. Для решения задачи классификации могут использо- ваться методы: ближайшего соседа (Nearest Neighbor); k-ближайшего со- – 13 – седа (k-Nearest Neighbor); байесовские сети (Bayesian Networks); индук- ция деревьев решений; нейронные сети (neural networks). Кластеризация является логическим продолжением идеи классифи- кации. Это задача более сложная, особенность кластеризации заключа- ется в том, что классы объектов изначально не предопределены. Резуль- татом кластеризации является разбиение объектов на группы. В результате решения задачи прогнозирования на основе особенно- стей исторических данных оцениваются пропущенные или же будущие значения целевых численных показателей. Для решения таких задач широко применяются методы математической статистики, нейронные се- ти и др. В ходе решения задачи поиска ассоциативных правил отыскиваются закономерности между связанными событиями в наборе данных. Отли- чие ассоциации от предыдущих задач Data Mining в том, что поиск за- кономерностей осуществляется не на основе свойств анализируемого объекта, а между несколькими событиями, которые происходят одно- временно. В результате визуализации создается графический образ анализируе- мых данных. Для решения задачи визуализации используются графиче- ские методы, показывающие наличие закономерностей в данных. Пример методов визуализации – представление данных в 2-D и 3-D измерениях. Согласно классификации по стратегиям, задачи Data Mining подраз- деляются на следующие группы: - обучение с учителем; - обучение без учителя. Категория «обучение с учителем» представлена следующими задача- ми Data Mining: классификация, оценка, прогнозирование. Категория «обучение без учителя» представлена задачей кластеризации. Задачи Data Mining в зависимости от используемых моделей могут быть дескриптивными и прогнозирующими. В соответствие с этой классификацией задачи Data Mining представ- лены группами описательных и прогнозирующих задач. В результате решения описательных задач аналитик получает шаблоны, описываю- щие данные, которые поддаются интерпретации. Эти задачи описывают общую концепцию анализируемых данных, определяют информативные, итоговые, отличительные особенности данных. Концепция описательных задач подразумевает характеристику и сравнение наборов данных. Ха- рактеристика набора данных обеспечивает краткое и сжатое описание – 14 – некоторого набора данных. Сравнение обеспечивает сравнительное опи- сание двух или более наборов данных. Прогнозирующие задачи основываются на анализе данных, создании модели, предсказании тенденций или свойств новых или неизвестных данных. Download 1.75 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling