– 74 –
В некоторых базах данных анализ показывает
неожиданно высокое
число людей, рожденных 11 ноября. Когда люди вынуждены заполнять
дату рождения за монитором, и они или не знают или не хотят обнаро-
довать
свою дату рождения, они склоняются набить 11-11-11. Само со-
бой разумеется, это катастрофично в контексте обнаружения знаний, так
как если информация неизвестна, то она должна и представляться так в
базе данных. В нашем примере мы заменили часть данных нулевым зна-
чением и исправили другие области несовместимости.
Обогащение (добавление информации)
. Предположим,
что мы полу-
чили дополнительную информацию о клиентах, состоящую из даты рож-
дения, дохода, размера кредита,
наличия автомобиля или дома
(табл.12.) Не очень важно, как была собрана информация, но необходи-
мо оценить, можно ли новую информацию присоединить к существую-
щим записям о клиентах.
Таблица 12
Обогащение
Имя
клиента
Дата
рождения
Доход
Кредит
Владелец
автомобиля
Do'stlaringiz bilan baham: