Цифровое телевизионное вещание doc


Download 0.59 Mb.
Pdf ko'rish
bet26/47
Sana09.02.2023
Hajmi0.59 Mb.
#1180494
1   ...   22   23   24   25   26   27   28   29   ...   47
Bog'liq
Belyaev yu v galochkin yu i cifrovoe televidenie

 
 
 
 
 
 
 
 
Рис. 3.1. Пример структуры описания сцены 
Верхний уровень структуры определяется сценой в целом. Сцена 
содержит неподвижный ФОН, состоящий из голубого неба, стволов и крон 
деревьев, зеленой травы, цветов и т.д. Кроме того в сцене присутствует поющая 
птичка, которая также является аудио–визуальным объектом, включающим 
видеообъект – изображение перелетающее с ветки на ветку, и аудиообъект – 
звуки исходящие от птички. 
Описание каждой сцены включает данные о координатах объектов в 
пространстве и их привязки ко времени. Видеообъекты могут размещаться в 
разных плоскостях видеообъектов (VOP), так что видеообъекты, находящиеся в 
более близких к зрителю плоскостях сцены перекрывают при движении 
видеообъекты, находящиеся в более дальних плоскостях. 
Сцена, представляемая пользователю может содержать все аудио-, 
видеообъекты или только часть этих объектов. Состав сцены может 
определяться поставщиком мультимедийной продукции. В интерактивном 
режиме пользователь может влиять на развитие сцены, подавая отсутствующие 
команды. 
Для реализации интерактивных возможностей стандарта MPEG-4 
необходим не обычный телевизор, а персональный компьютер, подключенный 
к сети. 
Сцена 
Красная 
шапочка 
Серый 
волк 
Поющая 
птичка 
ФОН 
Изображение 
Изображение 
Изображение 
Голос 
Голос 
Звук 


58
Стандарт MPEG-4 
использует целый набор методов кодирования, 
включая алгоритмы сходные с MPEG-2, 
так и принципиально новые 
основанные на понятии на понятии видеообъекта. Выбор метода кодирования в 
конкретном случае определяется характером изображения и требуемым 
коэффициентом сжатия информации. MPEG-4 
эффективно сжимает как 
натуральные, так и синтетические изображения и объединяет их при 
воспроизведении. 
Упрощенная структурная схема видеодекодера для натуральных 
изображений приведена на рис. 3.2. 
Рис. 3.2. Структурная схема видеодекодера MPEG-4 
Структурная схема видеодекодера состоит: 
ПДКП – процессор прямого дискретнокосинусного преобразования; 
ПОДКП – процессор обратного дискретнокосинусного преобразования; 
К – квантователь; 
ПДКП 
К 
Кодер 
текстур 
MUX 
ДК 
ПОДКП 
ЗУ 
БП1 
БОД 
БП2 
Кодер 
формы 




Вход 
Выбор 


59
ДК – деквантователь; 
ЗУ – запоминающее устройство; 
БП1, БП2 – блоки формирующие предсказанные изображения в разных 
режимах кодирования; 
БОД – блок оценки движения и формирования векторов движения; 
MUX – мультиплексор. 
В состав кодера также входят: кодер текстуры, кодер формы, вычитающее и 
суммирующее устройства и переключатель «Выбор» методов кодирования. 
На вход кодера поступают исходные видеоданные в цифровой форме, а 
на выходе формируется элементарный поток видеоданных. 
Рассмотрим основные методы кодирования натуральных изображений в 
стандарте MPEG-4. 
1. 
Видеообъекты, представляющие собой прямоугольные изображения 
(обычные ТВ кадры), кодируются методом аналогичным применяемому в 
MPEG-2, т.е. с использованием гибридного кодирования. Метод включает 
предсказания с оценкой и компенсацией движения для макроблоков 16x16 
пикселов и ДКП ошибки предсказания в блоках 8x8 пикселов. Предсказания в 
этом случае выполняется в блоке БП1. Этот вид кодирования имеет два уровня 
скорости передачи двоичных символов в потоке данных. Уровень очень низкой 
скорости передачи (VLBV) предназначен для передачи изображений с низким 
пространственным разрешением ( форматы QCIF и SQCIF), частотой кадров 
10÷15 Гц и со скоростями передачи двоичных символов 5 ÷64 кбит/с. Этот 
уровень можно использовать в видеотелефонной связи. 
Уровень высокой скорости передачи (HBV) предназначен для передачи 
изображений с высоким пространственным разрешением со скоростями 
передачи двоичных символов 64 кбит/с ÷ 10 Мбит/с. Этот уровень может 
использоваться для передачи телевизионных программ. 
2. 
Кодирование основанное на содержании сцены, позволяет получить 
существенно большее сжатие изображений за счет учета свойств видео-


60
объектов, присутствующих в сцене. 
Одной из возможностей, создаваемых этими методами, является 
кодирование видеообъектов сложной формы. Например, в качестве 
видеообъекта может быть взята область изображения, отличающаяся от 
окружения яркостью или цветом. Эта область может перемещаться и 
деформироваться. При формировании предсказанного изображения с 
компенсацией движения смещаются не прямоугольные макроблоки, а 
выделенные области, которые к тому же могут изменять свою форму. При этом 
ошибка предсказания оказывается значительно меньше, и объем информации, 
содержащийся в разности предсказанного и настоящего изображений 
очередного кадра, существенно уменьшается. В кодере такой вариант 
выполняется в блоке БП2. 
В то же время, вместо векторов движения, показывающих перемещение 
прямоугольного макроблока как целого, необходимо передавать параметры
характеризующие изменение координат и формы объекта. Эти параметры 
определяются и кодируются в кодере формы и после чего они через 
мультиплексор поступают в выходной поток данных. 
Данные о форме видеообъекта занимают значительно больше бит, чем 
простой вектор движения. Например, если граница области, выделенной как 
видеообъект представляется многоугольником, то для описания смещения и 
деформации этой области необходимо передать изменение координат всех 
углов многоугольника. Тем не менее, общий выигрыш в уменьшении 
передаваемой 
информации 
по 
сравнению 
с MPEG-2 
оказывается 
существенным. 
3. 
Для сжатия изображения неподвижного фона и текстур протяженных 
объектов используется метод кодирования, основанный на « вэйвлет»-
преобразовании. Этот метод обеспечивает высокие степени сжатия и 
многоступенчатую масштабируемость по пространственному разрешению. 
Синтетические видеообъекты, создаваемые с помощью компьютерной 


61
графики могут кодироваться рассмотренными ранее методами для натуральных 
изображений. Однако эффективнее использовать их параметрическое описание. 
В стандарте MPEG-4 
используются модель человеческого лица, 
построенная на основе сетки из треугольных ячеек, которые заполняются 
текстурой, и трехмерная модель человеческого тела в виде трехмерной сетки. 
Двумерные изображения человека получаются с помощью построения 
проекции трехмерной модели на нужную плоскость. 
Форма, текстура и выражение лица в статистике описываются 
параметрами FDP (Facial Definition Parameters) 
и в динамике – параметрами 
FAP (Facial Animation Parameters). Для тела в статике задаются параметры BDP 
(Body Definition Parameters), а в динамике BAP (Body Animation Parameters). 
Статические параметры FDP и BDP обычно передаются в начале сеанса связи. 
Для воспроизведения мимики лица и движения тела в процессе разговора 
передаются параметры FAP и BAP.
Синтетические изображения могут использоваться в системах видеосвязи 
в место настоящих изображений, при этом скорость передачи становится 
меньше, чем скорость передачи реального изображения. 
В некоторых случаях можно в приемной части системы получить 
информацию об изменениях изображения объекта на основе другой 
информации. Например, передача изображения лица говорящего человека. 
Движения рта и мимика во многом определяется произносимыми словами и 
могут быть синтезированы на основе принятого звукового сигнала, 
содержащего голос собеседника. В этом случае требуемая скорость цифровой 
передачи для осуществления видеосвязи еще уменьшается. 
Помимо лица и тела могут синтезироваться произвольные двумерные 
изображения в виде сеток с треугольными ячейками, заполняемыми текстурой. 
Для кодирования звуковой информации в MPEG-4 предусмотрено три 
уровня кодирования. 
1. 
Кодирование музыки с обеспечением высокого и среднего качества 


62
выполняется также методами, что и в стандарте MPEG-2. 
При этом 
обеспечивается передача восьми каналов звука при скорости 16 ÷64 кбит/с на 
канал. 
2. 
Для передачи речи с высоким и средним качеством применяется метод 
– кодирование возбуждений с линейным предсказанием, который обеспечивает 
скорости передачи 6÷24 кбит/с при частотах дискретизации 8 кГц или 16 кГц. 
3. 
Параметрическое кодирование речи, которое обеспечивает сжатие при 
сохранении разборчивости до скоростей 2÷4 кбит/с при частоте дискретизации 
8 кГц. 
Самые низкие скорости передачи 0,2 ÷1,2 кбит/с используются для 
искусственно синтезированной речи и синтезированной в соответствии со 
стандартом MIDI музыки. 
Кодирование аудиообъектов также обладает свойством масштаби-
руемости. Например, на основном уровне потока данных может использоваться 
метод кодирования CELP, а дополнительный уровень обеспечивает качество 
звука, соответствующее кодированию по MPEG-4. 
Передачу данных в стандарте MPEG-4 
рассмотрим с помощью 
структурной схемы приведенной на рис. 3.3. 
Элементарные потоки ES с видео- и аудиодекодеров поступают на 
уровень синхронизации (SL – Syns Layer) 
и блоках SL преобразуются в 
пакетизированные SL- потоки, в которые введены метки времени и данные о 
тактовых частотах для привязке к единой шкале времени различных видео- и 
аудиообъектов. Далее пакетизированные SL- потоки поступают на уровень 
DMIF. DMIF (Delivery Multimedia Integration Framework – 
интегрированная 
система доставки мультимедиа) – это протокол, обеспечивающий управление 
потоками данных для мультимедиа. Протокол DMIF обеспечивает посылку 
запросов от пользователя к источнику информации и пересылку запрошенных 
данных пользователю. Кроме того, DMIF 
дает пользователю средства 
управления в виде интерфейса пользователя DMIF – Application Interface (DAI), 


63
позволяя подавать команды для выбора информации ( например фильма) и 
формируя сообщения о получении доступа к этой информации или о 
возникших при этом трудностях. 

Download 0.59 Mb.

Do'stlaringiz bilan baham:
1   ...   22   23   24   25   26   27   28   29   ...   47




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling