таковыми не являются. Знания должны описывать новые связи между
свойствами, предсказывать значения
одних признаков на основе
других.
Нередко KDD отождествляют с Data Mining. Однако правильнее
считать Data Mining шагом процесса KDD.
Приведенные ниже примеры из разных областей экономики
демонстрируют основное преимущество методов Data Mining –
способность обнаружения новых знаний,
которые невозможно
получить методами статистического, регрессионного анализа или
эконометрики.
1. Множество клиентов компании с
помощью одного из
инструментов Data Mining были объединены в группы, или сегменты
со схожими признаками. Это позволило проводить компании
различную маркетинговую политику и строить отдельные модели
поведения для каждого клиентского сегмента.
Наиболее значимыми
факторами для разделения на группы оказались следующие:
удаленность региона клиента, сфера деятельности, среднегодовые
суммы сделок, количество сделок в неделю.
2. Автоматический анализ банковской базы данных кредитных
сделок
физических лиц выявил правила, по которым потенциальным
заемщикам отказывалось в выдаче кредита. В частности, решающими
факторами при выдаче кредитов на небольшие суммы, оказались: срок
кредита, среднемесячный доход и расход заемщика. В
дальнейшем это
учитывалось при экспресс-кредитовании наиболее дешевых товаров.
3. При анализе базы данных клиентов страховой компании
был установлен социальный портрет человека,
страхующего жизнь -
это оказался мужчина 35-50 лет,
13
0
имеющий 2 и более детей и среднемесячный доход выше $2000.
Задачи, решаемые методами Data Mining:
Do'stlaringiz bilan baham: