Цифровое телевизионное вещание doc
Download 0.59 Mb. Pdf ko'rish
|
Belyaev yu v galochkin yu i cifrovoe televidenie
Рис. 3.1. Пример структуры описания сцены Верхний уровень структуры определяется сценой в целом. Сцена содержит неподвижный ФОН, состоящий из голубого неба, стволов и крон деревьев, зеленой травы, цветов и т.д. Кроме того в сцене присутствует поющая птичка, которая также является аудио–визуальным объектом, включающим видеообъект – изображение перелетающее с ветки на ветку, и аудиообъект – звуки исходящие от птички. Описание каждой сцены включает данные о координатах объектов в пространстве и их привязки ко времени. Видеообъекты могут размещаться в разных плоскостях видеообъектов (VOP), так что видеообъекты, находящиеся в более близких к зрителю плоскостях сцены перекрывают при движении видеообъекты, находящиеся в более дальних плоскостях. Сцена, представляемая пользователю может содержать все аудио-, видеообъекты или только часть этих объектов. Состав сцены может определяться поставщиком мультимедийной продукции. В интерактивном режиме пользователь может влиять на развитие сцены, подавая отсутствующие команды. Для реализации интерактивных возможностей стандарта MPEG-4 необходим не обычный телевизор, а персональный компьютер, подключенный к сети. Сцена Красная шапочка Серый волк Поющая птичка ФОН Изображение Изображение Изображение Голос Голос Звук 58 Стандарт MPEG-4 использует целый набор методов кодирования, включая алгоритмы сходные с MPEG-2, так и принципиально новые основанные на понятии на понятии видеообъекта. Выбор метода кодирования в конкретном случае определяется характером изображения и требуемым коэффициентом сжатия информации. MPEG-4 эффективно сжимает как натуральные, так и синтетические изображения и объединяет их при воспроизведении. Упрощенная структурная схема видеодекодера для натуральных изображений приведена на рис. 3.2. Рис. 3.2. Структурная схема видеодекодера MPEG-4 Структурная схема видеодекодера состоит: ПДКП – процессор прямого дискретнокосинусного преобразования; ПОДКП – процессор обратного дискретнокосинусного преобразования; К – квантователь; ПДКП К Кодер текстур MUX ДК ПОДКП ЗУ БП1 БОД БП2 Кодер формы - + - + Вход Выбор 59 ДК – деквантователь; ЗУ – запоминающее устройство; БП1, БП2 – блоки формирующие предсказанные изображения в разных режимах кодирования; БОД – блок оценки движения и формирования векторов движения; MUX – мультиплексор. В состав кодера также входят: кодер текстуры, кодер формы, вычитающее и суммирующее устройства и переключатель «Выбор» методов кодирования. На вход кодера поступают исходные видеоданные в цифровой форме, а на выходе формируется элементарный поток видеоданных. Рассмотрим основные методы кодирования натуральных изображений в стандарте MPEG-4. 1. Видеообъекты, представляющие собой прямоугольные изображения (обычные ТВ кадры), кодируются методом аналогичным применяемому в MPEG-2, т.е. с использованием гибридного кодирования. Метод включает предсказания с оценкой и компенсацией движения для макроблоков 16x16 пикселов и ДКП ошибки предсказания в блоках 8x8 пикселов. Предсказания в этом случае выполняется в блоке БП1. Этот вид кодирования имеет два уровня скорости передачи двоичных символов в потоке данных. Уровень очень низкой скорости передачи (VLBV) предназначен для передачи изображений с низким пространственным разрешением ( форматы QCIF и SQCIF), частотой кадров 10÷15 Гц и со скоростями передачи двоичных символов 5 ÷64 кбит/с. Этот уровень можно использовать в видеотелефонной связи. Уровень высокой скорости передачи (HBV) предназначен для передачи изображений с высоким пространственным разрешением со скоростями передачи двоичных символов 64 кбит/с ÷ 10 Мбит/с. Этот уровень может использоваться для передачи телевизионных программ. 2. Кодирование основанное на содержании сцены, позволяет получить существенно большее сжатие изображений за счет учета свойств видео- 60 объектов, присутствующих в сцене. Одной из возможностей, создаваемых этими методами, является кодирование видеообъектов сложной формы. Например, в качестве видеообъекта может быть взята область изображения, отличающаяся от окружения яркостью или цветом. Эта область может перемещаться и деформироваться. При формировании предсказанного изображения с компенсацией движения смещаются не прямоугольные макроблоки, а выделенные области, которые к тому же могут изменять свою форму. При этом ошибка предсказания оказывается значительно меньше, и объем информации, содержащийся в разности предсказанного и настоящего изображений очередного кадра, существенно уменьшается. В кодере такой вариант выполняется в блоке БП2. В то же время, вместо векторов движения, показывающих перемещение прямоугольного макроблока как целого, необходимо передавать параметры, характеризующие изменение координат и формы объекта. Эти параметры определяются и кодируются в кодере формы и после чего они через мультиплексор поступают в выходной поток данных. Данные о форме видеообъекта занимают значительно больше бит, чем простой вектор движения. Например, если граница области, выделенной как видеообъект представляется многоугольником, то для описания смещения и деформации этой области необходимо передать изменение координат всех углов многоугольника. Тем не менее, общий выигрыш в уменьшении передаваемой информации по сравнению с MPEG-2 оказывается существенным. 3. Для сжатия изображения неподвижного фона и текстур протяженных объектов используется метод кодирования, основанный на « вэйвлет»- преобразовании. Этот метод обеспечивает высокие степени сжатия и многоступенчатую масштабируемость по пространственному разрешению. Синтетические видеообъекты, создаваемые с помощью компьютерной 61 графики могут кодироваться рассмотренными ранее методами для натуральных изображений. Однако эффективнее использовать их параметрическое описание. В стандарте MPEG-4 используются модель человеческого лица, построенная на основе сетки из треугольных ячеек, которые заполняются текстурой, и трехмерная модель человеческого тела в виде трехмерной сетки. Двумерные изображения человека получаются с помощью построения проекции трехмерной модели на нужную плоскость. Форма, текстура и выражение лица в статистике описываются параметрами FDP (Facial Definition Parameters) и в динамике – параметрами FAP (Facial Animation Parameters). Для тела в статике задаются параметры BDP (Body Definition Parameters), а в динамике BAP (Body Animation Parameters). Статические параметры FDP и BDP обычно передаются в начале сеанса связи. Для воспроизведения мимики лица и движения тела в процессе разговора передаются параметры FAP и BAP. Синтетические изображения могут использоваться в системах видеосвязи в место настоящих изображений, при этом скорость передачи становится меньше, чем скорость передачи реального изображения. В некоторых случаях можно в приемной части системы получить информацию об изменениях изображения объекта на основе другой информации. Например, передача изображения лица говорящего человека. Движения рта и мимика во многом определяется произносимыми словами и могут быть синтезированы на основе принятого звукового сигнала, содержащего голос собеседника. В этом случае требуемая скорость цифровой передачи для осуществления видеосвязи еще уменьшается. Помимо лица и тела могут синтезироваться произвольные двумерные изображения в виде сеток с треугольными ячейками, заполняемыми текстурой. Для кодирования звуковой информации в MPEG-4 предусмотрено три уровня кодирования. 1. Кодирование музыки с обеспечением высокого и среднего качества 62 выполняется также методами, что и в стандарте MPEG-2. При этом обеспечивается передача восьми каналов звука при скорости 16 ÷64 кбит/с на канал. 2. Для передачи речи с высоким и средним качеством применяется метод – кодирование возбуждений с линейным предсказанием, который обеспечивает скорости передачи 6÷24 кбит/с при частотах дискретизации 8 кГц или 16 кГц. 3. Параметрическое кодирование речи, которое обеспечивает сжатие при сохранении разборчивости до скоростей 2÷4 кбит/с при частоте дискретизации 8 кГц. Самые низкие скорости передачи 0,2 ÷1,2 кбит/с используются для искусственно синтезированной речи и синтезированной в соответствии со стандартом MIDI музыки. Кодирование аудиообъектов также обладает свойством масштаби- руемости. Например, на основном уровне потока данных может использоваться метод кодирования CELP, а дополнительный уровень обеспечивает качество звука, соответствующее кодированию по MPEG-4. Передачу данных в стандарте MPEG-4 рассмотрим с помощью структурной схемы приведенной на рис. 3.3. Элементарные потоки ES с видео- и аудиодекодеров поступают на уровень синхронизации (SL – Syns Layer) и блоках SL преобразуются в пакетизированные SL- потоки, в которые введены метки времени и данные о тактовых частотах для привязке к единой шкале времени различных видео- и аудиообъектов. Далее пакетизированные SL- потоки поступают на уровень DMIF. DMIF (Delivery Multimedia Integration Framework – интегрированная система доставки мультимедиа) – это протокол, обеспечивающий управление потоками данных для мультимедиа. Протокол DMIF обеспечивает посылку запросов от пользователя к источнику информации и пересылку запрошенных данных пользователю. Кроме того, DMIF дает пользователю средства управления в виде интерфейса пользователя DMIF – Application Interface (DAI), 63 позволяя подавать команды для выбора информации ( например фильма) и формируя сообщения о получении доступа к этой информации или о возникших при этом трудностях. Download 0.59 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling