Методические указания к лабораторным занятиям Интеллектуальные системы обработки информации и машинное обучение Ставрополь, 2017


Download 4.3 Mb.
Pdf ko'rish
bet62/121
Sana27.10.2023
Hajmi4.3 Mb.
#1727451
TuriМетодические указания
1   ...   58   59   60   61   62   63   64   65   ...   121
Bog'liq
78Metod IntelectSysObrInf 10.05.03 12.02.2017

Многомерные хранилища данных. Многомерная модель данных, 
лежащая в основе построения многомерных хранилищ данных (МХД), 
опирается на концепцию многомерных кубов, или гиперкубов. Они 
представляют собой упорядоченные многомерные массивы, которые 
также часто называют OLAP-кубами (аббревиатура OLAP 
расшифровывается 
как On-Line 
Analytical 
Processing 

оперативная 
аналитическая 
обработка). 
Технология 
OLAP 
представляет собой методику оперативного извлечения нужной 
информации из больших массивов данных и формирования 
соответствующих отчетов. 
Не следует пытаться провести геометрическую интерпретацию 
понятия «многомерный куб», поскольку это просто служебный 
термин, описывающий метод представления данных. 
В основе многомерного представления данных лежит их 
разделение на две группы – измерения и факты
Измерения 
– 
это 
категориальные атрибуты, 
наименования и 
свойства 
объектов, участвующих в 
14



некотором бизнес-процессе. Измерениями являются наименования 
товаров, названия фирм-поставщиков и покупателей, ФИО людей, 
названия городов и т. д. Измерения могут быть и числовыми, если 
какой-либо 
категории 
(например, 
наименованию 
товара) 
соответствует числовой код, но в любом случае это данные 
дискретные, то есть принимающие значения из ограниченного набора. 
Измерения качественно описывают исследуемый бизнес-процесс. 
Факты – это данные, количественно описывающие бизнес-
процесс, непрерывные по своему характеру, то есть они могут 
принимать бесконечное множество значений. Примеры фактов – цена 
товара или изделия, их количество, сумма продаж или закупок, 
зарплата сотрудников, сумма кредита, страховое вознаграждение и т. 
д. 
Структура многомерного куба. Многомерный куб можно 
рассматривать как систему координат, осями которой являются 
измерения, например, Дата, Товар, Город, а фактами - числовые 
значения, соответствующие этим измерениям. Принцип организации 
многомерного куба поясняется на рис.4.6. В такой системе каждому 
набору значений измерений (например, дата – товар – покупатель) 
будет соответствовать ячейка, в которой размещаются числовые 
показатели (то есть факты), связанные с данным набором. Таким 
образом, между объектами бизнес-процесса и их числовыми 
характеристиками будет установлена однозначная связь. Например в 
одной ячейке будут располагаться факты, относящиеся к продаже 
Товара2 во Владивостоке в декабре месяце. 
14



Рис. 4.6. Данные в трехмерном кубе. 
Кроме того, куб позволяет реализовать сечения данных. 
Сечение заключается в выделении подмножества ячеек гиперкуба при 
фиксировании значения одного или нескольких измерений. В 
результате сечения получается срез или несколько срезов, каждый из 
которых содержит информацию, связанную со значением измерения, 
по которому он был построен. Например, если выполнить сечение по 
значению «г. Москва» измерения Город, то полученный в результате 
срез будет содержать информацию об истории продаж всех товаров, 
которую можно будет свести в плоскую таблицу. При необходимости 
ограничить информацию только одним товаром (например, Товаром 
2) потребуется выполнить еще одно сечение, но теперь уже по 
значению Товар 2 измерения Товар. Результатом построения двух 
срезов будет информация о продажах в одном городе одного товара. 
Манипулируя таким образом сечениями гиперкуба, пользователь 
всегда может получить информацию в нужном разрезе. Затем на 
основе построенных срезов может быть сформирована кросс-таблица 
(рис 4.7), и с ее помощью очень быстро получен необходимый отчет. 
Данная методика лежит в основе технологии OLAP-анализа. 
147 


Рис. 4.7. Пример многомерного отчета. 
Таким образом, информация в многомерном хранилище данных 
является логически целостной. Это уже целостные структуры типа 
«кому, что и в каком количестве было продано на данный момент 
времени». 
Преимущества многомерного подхода к организации данных 
очевидны. 
Представление данных в виде многомерных кубов более 
наглядно, чем совокупность нормализованных таблиц реляционной 
модели, структуру которой представляет только администратор БД. 
Возможность 
построения 
более 
широкого 
спектра 
аналитических запросов. 
В некоторых случаях использование многомерной модели 
позволяет значительно уменьшить продолжительность поиска в ХД, 
обеспечивая выполнение аналитических запросов практически в 
режиме реального времени. Это связано с тем, что агрегированные 
данные 
148 


вычисляются предварительно и хранятся в многомерных кубах вместе 
с детализированными, поэтому тратить время на вычисление 
агрегатов при выполнении запроса уже не нужно. 
Использование многомерной модели данных сопряжено с 
определенными трудностями. Так, для ее реализации требуется 
больший объем памяти. Это связано с тем, что при реализации 
физической многомерности используется большое количество 
технической информации, поэтому объем данных, который может 
поддерживаться МХД, обычно не превышает нескольких десятков 
гигабайт. Кроме того, многомерная структура труднее поддается 
модификации; при необходимости встроить еще одно измерение 
требуется выполнить физическую перестройку всего многомерного 
куба. 
На основании этого можно сделать вывод, что применение 
систем хранения, в основе которых лежит многомерное представление 
данных, целесообразно только в тех случаях, когда объем 
используемых данных сравнительно невелик, а сама многомерная 
модель имеет стабильный набор измерений. 

Download 4.3 Mb.

Do'stlaringiz bilan baham:
1   ...   58   59   60   61   62   63   64   65   ...   121




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling