Основы информационных технологий


Download 1.75 Mb.
Pdf ko'rish
bet35/49
Sana15.12.2022
Hajmi1.75 Mb.
#1008307
TuriУчебное пособие
1   ...   31   32   33   34   35   36   37   38   ...   49
Bog'liq
Интеллектуальный анализ данных Чернышова

 
Область совместимости 
 
Номер 
клиента 
Имя 
Адрес 
Дата 
подписки 
Тип журнала 
23003 
Дженсон 
1 Downing Street 
04-15-94 
Автомобильный 
23003 
Дженсон 
1 Downing Street 
06-21-93 
Музыкальный 
23003 
Дженсон 
1 Downing Street 
05-30-92 
Комиксы 
23009 
Клинтон 
2 Boulevard 
NULL 
Комиксы 
23013 
Кинг 
3 High Road 
02-30-95 
Спортивный 
23003 
Дженсон 
1 Downing Street 
04-15-94 
"Дом" 


– 74 – 
В некоторых базах данных анализ показывает неожиданно высокое 
число людей, рожденных 11 ноября. Когда люди вынуждены заполнять 
дату рождения за монитором, и они или не знают или не хотят обнаро-
довать свою дату рождения, они склоняются набить 11-11-11. Само со-
бой разумеется, это катастрофично в контексте обнаружения знаний, так 
как если информация неизвестна, то она должна и представляться так в 
базе данных. В нашем примере мы заменили часть данных нулевым зна-
чением и исправили другие области несовместимости. 
Обогащение (добавление информации)
. Предположим, что мы полу-
чили дополнительную информацию о клиентах, состоящую из даты рож-
дения, дохода, размера кредита, наличия автомобиля или дома 
(табл.12.) Не очень важно, как была собрана информация, но необходи-
мо оценить, можно ли новую информацию присоединить к существую-
щим записям о клиентах. 
Таблица 12
 
Обогащение 
 
Имя 
клиента 
Дата 
рождения 
Доход 
Кредит 
Владелец 
автомобиля 

Download 1.75 Mb.

Do'stlaringiz bilan baham:
1   ...   31   32   33   34   35   36   37   38   ...   49




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling