Методические указания к лабораторным занятиям Интеллектуальные системы обработки информации и машинное обучение Ставрополь, 2017


Download 4.3 Mb.
Pdf ko'rish
bet54/121
Sana27.10.2023
Hajmi4.3 Mb.
#1727451
TuriМетодические указания
1   ...   50   51   52   53   54   55   56   57   ...   121
Bog'liq
78Metod IntelectSysObrInf 10.05.03 12.02.2017

Задачи и методы Data Mining. 
Термин Data Mining дословно переводится как «добыча данных» 
или «раскопка данных» и имеет в англоязычной среде несколько 
определений. 
Data Mining — обнаружение в «сырых» данных ранее 
неизвестных, нетривиальных, практически полезных и доступных 
интерпретации знаний, необходимых для принятия решений в 
различных сферах человеческой деятельности. 
Информация, найденная в процессе применения методов Data 
Mining, должна быть нетривиальной и ранее неизвестной, например, 
сведения о средних продажах 
12



таковыми не являются. Знания должны описывать новые связи между 
свойствами, предсказывать значения одних признаков на основе 
других. 
Нередко KDD отождествляют с Data Mining. Однако правильнее 
считать Data Mining шагом процесса KDD. 
Приведенные ниже примеры из разных областей экономики 
демонстрируют основное преимущество методов Data Mining – 
способность обнаружения новых знаний, которые невозможно 
получить методами статистического, регрессионного анализа или 
эконометрики. 
1. Множество клиентов компании с помощью одного из 
инструментов Data Mining были объединены в группы, или сегменты 
со схожими признаками. Это позволило проводить компании 
различную маркетинговую политику и строить отдельные модели 
поведения для каждого клиентского сегмента. Наиболее значимыми 
факторами для разделения на группы оказались следующие: 
удаленность региона клиента, сфера деятельности, среднегодовые 
суммы сделок, количество сделок в неделю. 
2. Автоматический анализ банковской базы данных кредитных 
сделок физических лиц выявил правила, по которым потенциальным 
заемщикам отказывалось в выдаче кредита. В частности, решающими 
факторами при выдаче кредитов на небольшие суммы, оказались: срок 
кредита, среднемесячный доход и расход заемщика. В дальнейшем это 
учитывалось при экспресс-кредитовании наиболее дешевых товаров. 
3. При анализе базы данных клиентов страховой компании 
был установлен социальный портрет человека, страхующего жизнь - 
это оказался мужчина 35-50 лет, 
13



имеющий 2 и более детей и среднемесячный доход выше $2000. 
Задачи, решаемые методами Data Mining: 

Download 4.3 Mb.

Do'stlaringiz bilan baham:
1   ...   50   51   52   53   54   55   56   57   ...   121




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling