П. Г. Демидова А. В. Зафиевский А. А. Короткин А. Н. Лататуев Базы данных Учебное пособие

Другие направления в организации

bet	15/94
Sana	15.06.2023
Hajmi	1.32 Mb.
	#1487605

1 ... 11 12 13 14 15 16 17 18 ... 94

Bog'liq
Базы данных

1.10. Другие направления в организации
и использовании баз данных
Остановимся кратко на направлениях развития баз данных,
которые ранее не были затронуты.
Специфической разновидностью баз данных являются БД ре-
ального времени, применяемые в системах, в которых время реак-
ции системы играет критическую роль. Это не означает, что выпол-
нение запроса должно быть очень быстрым, но требуется, чтобы
запрос был гарантированно выполнен за известное заранее время.
Однако, поскольку подобные требования наиболее естественно вы-
полнять в операционных системах реального времени (например,
QNX), разработчики БД реального времени для массовых ОС
пошли просто по пути резкого ускорения работы СУБД за счет
размещения всей базы данных в оперативной памяти.
Так, компанией Oracle была разработана технология
TimesTen и на ее основе – СУБД реального времени TimesTen
In-Memory Database, легко интегрируемая с СУБД Oracle. В каче-
стве другого примера можно привести СУБД RDM Mobile
компании Birdstep.
Заметное развитие в последнее время получили базы данных с
нетрадиционным наполнением: пространственными, временными и

21
мультимедийными данными. К этой же категории относятся и
получающие все большее применение геоинформационные систе-
мы. Средства для работы с пространственными (геометрическими)
данными включены, в частности, в последние версии СУБД от
компаний Oracle и Microsoft. Что касается временных баз данных,
то это направление развивается гораздо медленнее, в основном из-
за ограниченной потребности в специфических временных задачах.
Мультимедийные базы данных получили широкое распрост-
ранение в связи с расширением размеров сети Интернет и предо-
ставляемых ей сервисов. Серьезной проблемой здесь является ин-
дексация хранящихся в базе данных аудио- и видео- «докумен-
тов». В то время как для текстовых документов существует боль-
шое количество различных моделей автоматического формирова-
ния поискового образа документа, формирование поисковой моде-
ли для мультимедийных объектов представляется достаточно
сложным. В этом направлении следует отметить деятельность по
созданию стандарта MPEG-7. Обычно же организация мульти-
медийных БД выполняется по гораздо более простой схеме: для
каждого «документа» вручную готовится текстовое описание и
поиск ведется в базе данных этих описаний. Поскольку мультиме-
дийные базы данных чаще всего являются коммерческими, то при
их создании и эксплуатации возникает большое число проблем,
связанных с доставкой содержимого пользователям и оценкой
стоимости предоставленных услуг, однако эти проблемы чаще
всего лежат за пределами основной тематики баз данных.
Накопление информации в базах данных, поддерживающих
оперативную обработку производственной информации, привело
к появлению нового класса БД – т. н. хранилищ данных, по суще-
ству представляющих собой электронные архивы предприятия.
В отличие от систем оперативной обработки данных, хранящих
информацию ровно столько времени, сколько нужно для ее обра-
ботки, хранилища данных накапливают всю информацию, обра-
батываемую оперативными системами, проводят ее статистиче-
скую обработку и способны выдавать итоговую информацию с
различных точек зрения («в различных разрезах»). Примыкаю-
щей к этому направлению областью исследований является об-
ласть, обозначаемая термином, заимствованным из горнодобыва-
ющей отрасли, – «добыча данных» (data mining), более аккуратно
называемая интеллектуальным анализом данных. Цель этой дея-

22
тельности – обнаружение скрытых в громадном объеме информа-
ции хранилищ данных сведений (знаний) на основе математиче-
ских методов анализа данных: кластерного анализа, нейросете-
вых методов, генетических алгоритмов и т. д.
Еще одно направление в теории и практике баз данных –
параллельные и распределенные системы. Общим для обоих
типов систем является использование компьютеров, объединен-
ных в сеть, причем сеть может быть как локальной, так и удален-
ной. Различной же является степень связи компьютеров между
собой. В то время как в параллельных системах объединенные
компьютерные ресурсы направляются на решение одной задачи,
в распределенных системах, как правило, решаются разные зада-
чи, использующие частично объединенные данные. Это приводит
к тому, что организация взаимодействия между узлами сети в
параллельных и распределенных системах оказывается принци-
пиально различной. В частности, в распределенных системах
чаще всего применяется технология репликаций (тиражирования),
когда в различных узлах сети хранятся копии базы данных или ее
частей и регулярно (и не всегда немедленно) проводится синхро-
низация содержимого этих копий. Технология репликаций позво-
лила достаточно просто реализовать мобильные информацион-
ные системы, когда один или несколько узлов распределенной
базы данных хранятся на переносных компьютерах (ноутбуках
и т. п.). В определенные промежутки времени эти компьютеры
могут подключаться к головной сети, в том числе с помощью
беспроводного соединения, проводить синхронизацию информа-
ции и отключаться. В результате получается распределенная база
данных, структура которой динамически изменяется во времени,
оставаясь, тем не менее, полностью управляемой.
Повсеместное внедрение сети Интернет привело и к измене-
ниям во взгляде на базы данных. Не говоря уже о том, что весь
Интернет в целом подпадает под определение базы данных в ши-
роком смысле (совместно используемые данные с электронным
описанием их структуры, поддерживаемым консорциумом W3C),
стали появляться технологии, характерные для работы с базами
данных, но применяемые при работе через Интернет. В первую
очередь речь идет об интернет-сервисах, предоставляющих
конкретные данные (прогноз погоды, курсы валют, программы

23
телепередач и т. п.), которые могут быть автоматически (без
участия человека) получены и использованы.
Специфика Интернета возобновила интерес к базам данных,
использующих в качестве входящей информации часто приме-
няемые в этой сети потоки данных. По существу они пред-
ставляют собой базы данных реального времени, но работающие
не в локальной, а в глобальной сети.
В заключение упомянем такое явление, как семантическая па-
утина (Semantic Web), целью создания которой является реализация
возможности автоматической обработки информации, доступной в
Интернете. Средством для этого выступает формирование
метаданных на специализированном языке OWL, однозначно ха-
рактеризующих свойства и содержание ресурсов в Интернете по
какой-либо предметной области, вместо используемого в настоящее
время частотного и лексического анализа текстового содержимого
документов. По существу это означает введение жестких структур в
крайне слабо структурированную базу данных под названием
«Интернет». Впрочем, Интернет развивается настолько быстро,
особенно в части использования мультимедийного содержимого,
что заявленная в 2001 году основателем Web Тимом Бернерсом-Ли
концепция семантической паутины заметно устарела и либо будет
серьезно переработана, либо вместо этого будут применяться другие
средства, которые обеспечат не меньшие возможности.

Download 1.32 Mb.

Do'stlaringiz bilan baham:

1 ... 11 12 13 14 15 16 17 18 ... 94