П. Г. Демидова А. В. Зафиевский А. А. Короткин А. Н. Лататуев Базы данных Учебное пособие
Другие направления в организации
Download 1.32 Mb. Pdf ko'rish
|
Базы данных
1.10. Другие направления в организации
и использовании баз данных Остановимся кратко на направлениях развития баз данных, которые ранее не были затронуты. Специфической разновидностью баз данных являются БД ре- ального времени, применяемые в системах, в которых время реак- ции системы играет критическую роль. Это не означает, что выпол- нение запроса должно быть очень быстрым, но требуется, чтобы запрос был гарантированно выполнен за известное заранее время. Однако, поскольку подобные требования наиболее естественно вы- полнять в операционных системах реального времени (например, QNX), разработчики БД реального времени для массовых ОС пошли просто по пути резкого ускорения работы СУБД за счет размещения всей базы данных в оперативной памяти. Так, компанией Oracle была разработана технология TimesTen и на ее основе – СУБД реального времени TimesTen In-Memory Database, легко интегрируемая с СУБД Oracle. В каче- стве другого примера можно привести СУБД RDM Mobile компании Birdstep. Заметное развитие в последнее время получили базы данных с нетрадиционным наполнением: пространственными, временными и 21 мультимедийными данными. К этой же категории относятся и получающие все большее применение геоинформационные систе- мы. Средства для работы с пространственными (геометрическими) данными включены, в частности, в последние версии СУБД от компаний Oracle и Microsoft. Что касается временных баз данных, то это направление развивается гораздо медленнее, в основном из- за ограниченной потребности в специфических временных задачах. Мультимедийные базы данных получили широкое распрост- ранение в связи с расширением размеров сети Интернет и предо- ставляемых ей сервисов. Серьезной проблемой здесь является ин- дексация хранящихся в базе данных аудио- и видео- «докумен- тов». В то время как для текстовых документов существует боль- шое количество различных моделей автоматического формирова- ния поискового образа документа, формирование поисковой моде- ли для мультимедийных объектов представляется достаточно сложным. В этом направлении следует отметить деятельность по созданию стандарта MPEG-7. Обычно же организация мульти- медийных БД выполняется по гораздо более простой схеме: для каждого «документа» вручную готовится текстовое описание и поиск ведется в базе данных этих описаний. Поскольку мультиме- дийные базы данных чаще всего являются коммерческими, то при их создании и эксплуатации возникает большое число проблем, связанных с доставкой содержимого пользователям и оценкой стоимости предоставленных услуг, однако эти проблемы чаще всего лежат за пределами основной тематики баз данных. Накопление информации в базах данных, поддерживающих оперативную обработку производственной информации, привело к появлению нового класса БД – т. н. хранилищ данных, по суще- ству представляющих собой электронные архивы предприятия. В отличие от систем оперативной обработки данных, хранящих информацию ровно столько времени, сколько нужно для ее обра- ботки, хранилища данных накапливают всю информацию, обра- батываемую оперативными системами, проводят ее статистиче- скую обработку и способны выдавать итоговую информацию с различных точек зрения («в различных разрезах»). Примыкаю- щей к этому направлению областью исследований является об- ласть, обозначаемая термином, заимствованным из горнодобыва- ющей отрасли, – «добыча данных» (data mining), более аккуратно называемая интеллектуальным анализом данных. Цель этой дея- 22 тельности – обнаружение скрытых в громадном объеме информа- ции хранилищ данных сведений (знаний) на основе математиче- ских методов анализа данных: кластерного анализа, нейросете- вых методов, генетических алгоритмов и т. д. Еще одно направление в теории и практике баз данных – параллельные и распределенные системы. Общим для обоих типов систем является использование компьютеров, объединен- ных в сеть, причем сеть может быть как локальной, так и удален- ной. Различной же является степень связи компьютеров между собой. В то время как в параллельных системах объединенные компьютерные ресурсы направляются на решение одной задачи, в распределенных системах, как правило, решаются разные зада- чи, использующие частично объединенные данные. Это приводит к тому, что организация взаимодействия между узлами сети в параллельных и распределенных системах оказывается принци- пиально различной. В частности, в распределенных системах чаще всего применяется технология репликаций (тиражирования), когда в различных узлах сети хранятся копии базы данных или ее частей и регулярно (и не всегда немедленно) проводится синхро- низация содержимого этих копий. Технология репликаций позво- лила достаточно просто реализовать мобильные информацион- ные системы, когда один или несколько узлов распределенной базы данных хранятся на переносных компьютерах (ноутбуках и т. п.). В определенные промежутки времени эти компьютеры могут подключаться к головной сети, в том числе с помощью беспроводного соединения, проводить синхронизацию информа- ции и отключаться. В результате получается распределенная база данных, структура которой динамически изменяется во времени, оставаясь, тем не менее, полностью управляемой. Повсеместное внедрение сети Интернет привело и к измене- ниям во взгляде на базы данных. Не говоря уже о том, что весь Интернет в целом подпадает под определение базы данных в ши- роком смысле (совместно используемые данные с электронным описанием их структуры, поддерживаемым консорциумом W3C), стали появляться технологии, характерные для работы с базами данных, но применяемые при работе через Интернет. В первую очередь речь идет об интернет-сервисах, предоставляющих конкретные данные (прогноз погоды, курсы валют, программы 23 телепередач и т. п.), которые могут быть автоматически (без участия человека) получены и использованы. Специфика Интернета возобновила интерес к базам данных, использующих в качестве входящей информации часто приме- няемые в этой сети потоки данных. По существу они пред- ставляют собой базы данных реального времени, но работающие не в локальной, а в глобальной сети. В заключение упомянем такое явление, как семантическая па- утина (Semantic Web), целью создания которой является реализация возможности автоматической обработки информации, доступной в Интернете. Средством для этого выступает формирование метаданных на специализированном языке OWL, однозначно ха- рактеризующих свойства и содержание ресурсов в Интернете по какой-либо предметной области, вместо используемого в настоящее время частотного и лексического анализа текстового содержимого документов. По существу это означает введение жестких структур в крайне слабо структурированную базу данных под названием «Интернет». Впрочем, Интернет развивается настолько быстро, особенно в части использования мультимедийного содержимого, что заявленная в 2001 году основателем Web Тимом Бернерсом-Ли концепция семантической паутины заметно устарела и либо будет серьезно переработана, либо вместо этого будут применяться другие средства, которые обеспечат не меньшие возможности. Download 1.32 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling