П. Г. Демидова А. В. Зафиевский А. А. Короткин А. Н. Лататуев Базы данных Учебное пособие


 Другие направления в организации


Download 1.32 Mb.
Pdf ko'rish
bet15/94
Sana15.06.2023
Hajmi1.32 Mb.
#1487605
1   ...   11   12   13   14   15   16   17   18   ...   94
Bog'liq
Базы данных

1.10. Другие направления в организации 
и использовании баз данных 
Остановимся кратко на направлениях развития баз данных
которые ранее не были затронуты. 
Специфической разновидностью баз данных являются БД ре-
ального времени, применяемые в системах, в которых время реак-
ции системы играет критическую роль. Это не означает, что выпол-
нение запроса должно быть очень быстрым, но требуется, чтобы 
запрос был гарантированно выполнен за известное заранее время. 
Однако, поскольку подобные требования наиболее естественно вы-
полнять в операционных системах реального времени (например, 
QNX), разработчики БД реального времени для массовых ОС 
пошли просто по пути резкого ускорения работы СУБД за счет 
размещения всей базы данных в оперативной памяти. 
Так, компанией Oracle была разработана технология 
TimesTen и на ее основе – СУБД реального времени TimesTen 
In-Memory Database, легко интегрируемая с СУБД Oracle. В каче-
стве другого примера можно привести СУБД RDM Mobile 
компании Birdstep. 
Заметное развитие в последнее время получили базы данных с 
нетрадиционным наполнением: пространственными, временными и 


21 
мультимедийными данными. К этой же категории относятся и 
получающие все большее применение геоинформационные систе-
мы. Средства для работы с пространственными (геометрическими) 
данными включены, в частности, в последние версии СУБД от 
компаний Oracle и Microsoft. Что касается временных баз данных, 
то это направление развивается гораздо медленнее, в основном из-
за ограниченной потребности в специфических временных задачах. 
Мультимедийные базы данных получили широкое распрост-
ранение в связи с расширением размеров сети Интернет и предо-
ставляемых ей сервисов. Серьезной проблемой здесь является ин-
дексация хранящихся в базе данных аудио- и видео- «докумен-
тов». В то время как для текстовых документов существует боль-
шое количество различных моделей автоматического формирова-
ния поискового образа документа, формирование поисковой моде-
ли для мультимедийных объектов представляется достаточно 
сложным. В этом направлении следует отметить деятельность по 
созданию стандарта MPEG-7. Обычно же организация мульти-
медийных БД выполняется по гораздо более простой схеме: для 
каждого «документа» вручную готовится текстовое описание и 
поиск ведется в базе данных этих описаний. Поскольку мультиме-
дийные базы данных чаще всего являются коммерческими, то при 
их создании и эксплуатации возникает большое число проблем, 
связанных с доставкой содержимого пользователям и оценкой 
стоимости предоставленных услуг, однако эти проблемы чаще 
всего лежат за пределами основной тематики баз данных. 
Накопление информации в базах данных, поддерживающих 
оперативную обработку производственной информации, привело 
к появлению нового класса БД – т. н. хранилищ данных, по суще-
ству представляющих собой электронные архивы предприятия. 
В отличие от систем оперативной обработки данных, хранящих 
информацию ровно столько времени, сколько нужно для ее обра-
ботки, хранилища данных накапливают всю информацию, обра-
батываемую оперативными системами, проводят ее статистиче-
скую обработку и способны выдавать итоговую информацию с 
различных точек зрения («в различных разрезах»). Примыкаю-
щей к этому направлению областью исследований является об-
ласть, обозначаемая термином, заимствованным из горнодобыва-
ющей отрасли, – «добыча данных» (data mining), более аккуратно 
называемая интеллектуальным анализом данных. Цель этой дея-


22 
тельности – обнаружение скрытых в громадном объеме информа-
ции хранилищ данных сведений (знаний) на основе математиче-
ских методов анализа данных: кластерного анализа, нейросете-
вых методов, генетических алгоритмов и т. д. 
Еще одно направление в теории и практике баз данных – 
параллельные и распределенные системы. Общим для обоих 
типов систем является использование компьютеров, объединен-
ных в сеть, причем сеть может быть как локальной, так и удален-
ной. Различной же является степень связи компьютеров между 
собой. В то время как в параллельных системах объединенные 
компьютерные ресурсы направляются на решение одной задачи, 
в распределенных системах, как правило, решаются разные зада-
чи, использующие частично объединенные данные. Это приводит 
к тому, что организация взаимодействия между узлами сети в 
параллельных и распределенных системах оказывается принци-
пиально различной. В частности, в распределенных системах 
чаще всего применяется технология репликаций (тиражирования), 
когда в различных узлах сети хранятся копии базы данных или ее 
частей и регулярно (и не всегда немедленно) проводится синхро-
низация содержимого этих копий. Технология репликаций позво-
лила достаточно просто реализовать мобильные информацион-
ные системы, когда один или несколько узлов распределенной 
базы данных хранятся на переносных компьютерах (ноутбуках 
и т. п.). В определенные промежутки времени эти компьютеры 
могут подключаться к головной сети, в том числе с помощью 
беспроводного соединения, проводить синхронизацию информа-
ции и отключаться. В результате получается распределенная база 
данных, структура которой динамически изменяется во времени, 
оставаясь, тем не менее, полностью управляемой. 
Повсеместное внедрение сети Интернет привело и к измене-
ниям во взгляде на базы данных. Не говоря уже о том, что весь 
Интернет в целом подпадает под определение базы данных в ши-
роком смысле (совместно используемые данные с электронным 
описанием их структуры, поддерживаемым консорциумом W3C), 
стали появляться технологии, характерные для работы с базами 
данных, но применяемые при работе через Интернет. В первую 
очередь речь идет об интернет-сервисах, предоставляющих 
конкретные данные (прогноз погоды, курсы валют, программы 


23 
телепередач и т. п.), которые могут быть автоматически (без 
участия человека) получены и использованы. 
Специфика Интернета возобновила интерес к базам данных, 
использующих в качестве входящей информации часто приме-
няемые в этой сети потоки данных. По существу они пред-
ставляют собой базы данных реального времени, но работающие 
не в локальной, а в глобальной сети. 
В заключение упомянем такое явление, как семантическая па-
утина (Semantic Web), целью создания которой является реализация 
возможности автоматической обработки информации, доступной в 
Интернете. Средством для этого выступает формирование 
метаданных на специализированном языке OWL, однозначно ха-
рактеризующих свойства и содержание ресурсов в Интернете по 
какой-либо предметной области, вместо используемого в настоящее 
время частотного и лексического анализа текстового содержимого 
документов. По существу это означает введение жестких структур в 
крайне слабо структурированную базу данных под названием 
«Интернет». Впрочем, Интернет развивается настолько быстро, 
особенно в части использования мультимедийного содержимого, 
что заявленная в 2001 году основателем Web Тимом Бернерсом-Ли 
концепция семантической паутины заметно устарела и либо будет 
серьезно переработана, либо вместо этого будут применяться другие 
средства, которые обеспечат не меньшие возможности. 

Download 1.32 Mb.

Do'stlaringiz bilan baham:
1   ...   11   12   13   14   15   16   17   18   ...   94




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling