Методические указания к лабораторным занятиям Интеллектуальные системы обработки информации и машинное обучение Ставрополь, 2017


Download 4.3 Mb.
Pdf ko'rish
bet66/121
Sana27.10.2023
Hajmi4.3 Mb.
#1727451
TuriМетодические указания
1   ...   62   63   64   65   66   67   68   69   ...   121
Bog'liq
78Metod IntelectSysObrInf 10.05.03 12.02.2017

Пример. Устоявшейся практикой при использовании ХД 
является ночная загрузка собранных за день данных из OLTP-систем. 
Такой регламент позволяет уменьшить нагрузку на OLTP-систему в 
период ее активного использования. Однако подобная практика не 
обеспечивает возможности анализировать информацию в течение 
рабочего дня. Использование ВХД снимает эту проблему, поскольку 
такое хранилище не требует загрузки данных, а может предоставить 
актуальную информацию по первому требованию. 
Таким образом, применение ВХД оказывается полезным для 
предприятий, которые не имеют технических средств и 
квалифицированного персонала для поддержки физических ХД. 
Особенно 
велики 
преимущества ВХД 
при 
необходимости 
анализировать самую свежую информацию. В ВХД отсутствует этап 
загрузки данных, поэтому временной интервал между появлением 
информации в OLTP-системе и ее готовностью к анализу данных 
минимален. При этом следует учитывать, что, поскольку ВХД 
поддерживает историческую информацию только за период 
актуальности 
OLTP-систем, 
применение 
такого 
хранилища 
оправданно лишь тогда, когда исторические данные для анализа не 
требуются. 
16



4.3. Средства реализации интеллектуального анализа 
данных 
Программное обеспечение в области интеллектуального анализа 
данных. 
Даже самые мощные технологии извлечения закономерностей и 
машинного обучения, такие как KDD и Data Mining, не представляют 
особой ценности без инструментальной поддержки в виде 
соответствующего 
программного обеспечения. Рынок программных средств продолжает 
формироваться по сей день, однако в этой области уже можно 
выделить некоторые стандарты де-факто. 
Рынок программного обеспечения KDD и Data Mining делится 
на несколько сегментов (рис.4.12). 
Рис.4.12 Классификация ПО в области Data Mining и KDD. 
Статистические пакеты с возможностями Data Mining и 
настольные Data Mining пакеты ориентированы в основном на 
профессиональных пользователей. Их отличительные особенности: 
162 


 слабая интеграция с промышленными источниками данных; 
бедные средства очистки, предобработки и трансформации 
данных; 
отсутствие гибких возможностей консолидации информации, 
например, в специализированном хранилище данных; 
конвейерная (поточная) обработка новых данных 
затруднительна или реализуется встроенными языками 
программирования и требует высокой квалификации; из-за 
использования пакетов на локальных рабочих станциях обработка 
больших объемов данных затруднена. 
Настольные Data Mining пакеты могут быть ориентированы на 
решение всех классов задач Data Mining или какого-либо одного
например кластеризации или классификации. Вместе с тем эти пакеты 
предоставляют богатые возможности в плане алгоритмов, что 
достаточно для решения исследовательских задач. 
Недостатком 
пакетов 
является 
невозможность 
создания 
прикладных решений промышленного уровня. 
СУБД с элементами Data Mining. Практически все крупные 
производители систем управления базами данных (СУБД) включают в 
состав своих продуктов средства для анализа данных, OLAP, а также 
поддержку хранилищ данных. Эти инструменты как бы 
«встраиваются» в СУБД. Отличительные особенности СУБД с 
элементами Data Mining: 
высокая производительность
16



 алгоритмы анализа данных по максимуму используют 
преимущества СУБД; 
жесткая привязка всех технологий анализа к одной СУБД; 
сложность в создании прикладных решений, поскольку 
работа с СУБД ориентирована на программистов и 
администраторов баз данных. 
Аналитические платформы. В отличие от СУБД с набором 
алгоритмов Data Mining, аналитические платформы изначально 
ориентированы на анализ данных и предназначены для создания 
готовых решений промышленного уровня. Они позволяют наиболее 
полно реализовать все этапы KDD. 

Download 4.3 Mb.

Do'stlaringiz bilan baham:
1   ...   62   63   64   65   66   67   68   69   ...   121




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling