В рубрику "Оборудование и технологии" | К списку рубрик | К списку авторов | К списку публикаций
Дэвид Вуд
Глава департамента новых технологий EBU
Историю разработки и усовершенствования кодеков, изложенную в первой части данной статьи, можно схематично показать на рисунке (MPEG-1 и более ранние кодеки не включены для экономии места). В основу построения этой схемы положена усовершенствованная модель кодека MPEG-2, которая всем хорошо известна. Очень важно иметь в виду, что уже после того, как все основные инструменты компрессии были объединены в рамках MPEG-2, удалось достичь существенного улучшения качественных показателей. Прогресс в совершенствовании кодеков MPEG-2 наблюдается даже сегодня
Границы качества кодеков: "русские степи"
При построении указанной схемы подразумевалась скорость потока компрессированных видеоданных, необходимая для достижения заданного уровня качества изображения, например, соответствующего 4,5 баллам шкалы качества, что обычно удовлетворяет требованиям телевизионного вещания. Второе предположение заключалось в том, что этого уровня качества необходимо достигать при кодировании программного материала, отличающегося определенной критичностью изображения (обычно выбираются изображения, которые являются критичными, но не чрезмерно).
На схеме изображена линия поколения MPEG-кодеков, следующих за MPEG-2, - это MPEG-4 Part 4, а также последний формат MPEG- MPEG-4 Part 10 (или Н.264). Четвертая линия относится к будущей системе компрессии, спецификация которой еще не представлена к стандартизации. Отметим, что на практике это будут кривые, а не прямые линии, причем у разных уровней качества они также будут разными.
Теперь перейдем к подробному описанию этой схемы для того, чтобы читатели смогли понять суть рассматриваемой проблемы.
Эффективность кодека повышалась (уменьшалась скорость передачи, необходимая для данного качества) в течение нескольких лет после стандартизации инструментов компрессии. Затем наблюдаются скачкообразные изменения, соответствующие разработке новых кодеков. Диапазоны изменения эффективности коде ков частично перекрываются, но с каждой новой системой компрессии улучшаются показатели. Таким образом, мы видим, что долговременный и непрерывный прогресс в общем улучшении видеокомпрессии складывается из сравнительно краткосрочных циклов совершенствования отдельных систем компрессии.
Автор статьи обобщил доступную информацию об оценках качества кодеков и сделал вывод, что длительность внутреннего цикла улучшения показателей в рамках одной системы компрессии равна 5-8 годам. Улучшение эффективности кодеков для телевидения стандартной четкости, достигаемое за один год, составляет в среднем 5-10%. Конечно, это еще не окончательный прогноз, и исследователи дадут более точную оценку данному процессу. Но абсолютные величины — это не главное. Суть состоит в оценке происходящих перемен и в определении факторов, которые обязательно нужно учитывать при рассуждениях.
Что касается Windows Media Player 9, то мы можем предположить (базируясь на работе, проделанной EBU и описанной в отчете EBU Information Document 135), что эта система попадает в интервал между MPEG-4 Part 4 и MPEG-4 Part 10. Однако ее точная оценка будет зависеть от заданного абсолютного уровня качества и от того, какие алгоритмы будут установлены в кодеке WM9. Можно ожидать разработки новых семейств инструментов компрессии, которые будут появляться по мере роста степени интеграции полупроводниковых схем. Система, построенная на основе преобразования Wavelet вместо дискретного косинусного преобразования, вероятно, последует за Н.264.
Улучшение характеристик кодеков
Новые семейства улучшенных инструментов компрессии доступны лишь тогда, когда согласованы все стандарты. Как появляется возможность их совершенствования?
Цифровые системы видеокомпрессии имеют общую структуру. Ее основополагающий принцип состоит в извлечении из изображения избыточной информации (избыточной в том смысле, что она может быть восстановлена в приемнике) и нахождении самого эффективного способа передачи данных.
Процесс компрессии состоит из трех этапов: во-первых, это "компенсация движения", во-вторых, "кодирование с использованием преобразований" и, в-третьих, "статистическое кодирование". Перечисленные этапы следуют один за другим в процессе обработки цифрового видеосигнала.
Первый этап компрессии -компенсация движений. Сначала система выявляет, какие фрагменты изображения уже присутствовали в предыдущих кадрах, и вместо передачи этих фрагментов приемнику посылается информация о том, где конкретно в предыдущих кадрах эти фрагменты были найдены. Затем оставшаяся часть изображения подвергается кодированию с использованием преобразований. На данном этапе мы преобразуем сигнал из временной области (реальный сигнал) в частотную (представление сигнала в виде совокупности частотных компонентов). После этого подавляем частотные компоненты малой величины (потому что они наименее заметны) и переходим к следующему этапу — статистическому кодированию. Здесь мы анализируем кодовые слова видеоданных, поступившие за некоторый период времени, и перекодируем их таким образом, что наиболее часто встречающиеся слова преобразуются в самые короткие кодовые комбинации. Когда все это проделано, мы выпускаем сигнал в эфир.
Каким образом можно сделать указанный процесс более эффективным, используя все увеличивающуюся вычислительную мощность процессоров?
На первом этапе, то есть на этапе компенсации движения, можно увеличить область, в пределах которой ведется поиск фрагментов изображения, переданных в предыдущих кадрах.
На втором этапе можно делить изображение на блоки, размеры которых меньше или которые адаптируются к содержанию изображения.
На третьем этапе можно увеличить интервал времени, в котором анализируется частота кодовых слов, или использовать иные способы статистического кодирования.
Все указанные методы непросты, но именно они являются основными способами улучшения характеристик кодеков.
Как долго могут продолжаться такие усовершенствования? Ясно, что скорость потока данных, необходимая для передачи видеосигнала с высоким качеством, не может быть сведена к нулю. Хотя применение большей компрессии может увеличить среднюю эффективность при однократном кодировании, но это приведет к тому, что если изображение будет очень "критичным", то есть трудно "сжимаемым", возникающие при компрессии артефакты могут полностью его исказить.
Надо также иметь в виду, что чем больше компрессия, тем меньше запас устойчивости сигнала. Если вы устраните из сигнала изображения всю избыточность, то существует риск, что прохождение такого сигнала через второй кодек или какую-нибудь другую систему обработки изображений вызовет заметные и недопустимые искажения. Степень компрессии должна быть меньше в телевизионных системах, в которых сигнал будет подвергаться большому числу преобразований и процедур обработки (по сравнению с простыми телевизионными системами, в которых дополнительная обработка отсутствует).
Степень компрессии должна быть меньше и в том случае, если малейшие искажения изображения будут раздражать зрителей.
Как было сказано, за появлением MPEG-4 Part 10 последуют, вероятно, два цикла качественного совершенствования видеокомпрессии. На полное улучшение характеристик кодеков потребуется порядка десяти лет.
Количественные оценки сравнительных показателей кодеков
Всегда найдется множество причин для того, чтобы не делать количественных выводов о характеристиках кодеков, но это не поможет нам в определении стратегии. Однако можно надеяться на то, что, рассматривая и понимая скрытые или неявные факторы, мы сделаем разумные выводы. Надо иметь в виду, что результаты сравнения будут зависеть от выбранного уровня качества и от содержания программных материалов, то есть от детальности и динамичности телевизионных изображений.
Автор статьи проверил доступные результаты качественной оценки в двух областях. Первая из указанных областей -это соотношение между MPEG-2 (наиболее успешный в мировой практике кодек) и системой следующего поколения MPEG-4 Part 4, или MPEG-4 Visual, a вторая — соотношение между качеством, достигаемым MPEG-2, и новой системой Н.264, или MPEG-4 Part 10.
MPEG-4 Part 4 и MPEG-4 Part 10 используют в декодерах приемников более сложную обработку, чем MPEG-2, но это ожидалось и это "допустимо" в рамках закона Мура. Автор полагает, что существующая информация (хотя ее и меньше, чем хотелось бы иметь) позволяет сделать следующее заключение, которое основано на экспериментальных данных и может использоваться для общего понимания различий между разными системами компрессии. При этом надо иметь в виду, что такое заключение относится к программным материалам, не обладающим чрезмерно высокой критичностью.
Ниже приведены скорости передачи, соответствующие хорошему качеству для некоторых важных уровней четкости. Свойства MPEG-4 Part 4 рассматриваются на трех уровнях: телевидение стандартной четкости SDTV (качество PAL/SECAM), формат CIF (Common Interchange Format), который имеет разрешение в четверть изображения SDTV и используется в некоторых случаях в широкополосном Интернете, а также формат QCIF, обладающий разрешением в четверть CIF. Он также используется в Интернете. Система MPEG-4 Part 10 рассматривается на уровнях HDTV (четкость приблизительно в 4 раза больше, чем в телевидении стандартной четкости SDTV), SDTV и CIF.
Система MPEG-4 Part 4 в сравнении с MPEG-2:
Система MPEG-4 Part 10 в сравнении c MPEG-2:
Из приведенных данных следует, что показатели и MPEG-4 Part 4, и MPEG-4 Part 10 лучше (у них требуемая скорость потока меньше), чем у MPEG-2. Выигрыш, получаемый с помощью MPEG-4, уменьшается с увеличением четкости изображения. Система MPEG-4 Part 10 дает заметный выигрыш вплоть до SDTV. При малых уровнях четкости эффективность MPEG-4 Part 10 существенно выше, но достаточен ли этот выигрыш для обоснования замены MPEG-2 одной из систем следующих поколений?
Цена лицензирования
Еще одним фактором, требующим тщательного рассмотрения, являются цены. Начальная стоимость оборудования для новых систем зачастую высока, поскольку затраты на исследования и разработки должны быть компенсированы. Но кроме стоимости оборудования и бренда производителя при выборе системы компрессии нужно рассматривать и стоимость лицензирования. Все организации, занимающиеся стандартами, предлагают спецификации, которые лицензируются на "честных, разумных и не дискриминационных" принципах. Конечно, это звучит прекрасно, но никто не знает точно, что означает данное сочетание слов, особенно слово "разумный".
Лицензирование MPEG-2 основывается на плате за приемник, которая составляет обычно около $2,5. С этой системой легко работать, заранее зная, что и сколько стоит.
Но планируемый для MPEG-4 Part 4 новый режим лицензирования отличается от предыдущего. Новшество заключается в том, что для специальных служб или для мобильных сервисов лицензия предусматривает оплату за час использования. Не секрет, что вещатели всего мира озабочены оплатой только за факт использования, они полагают, что такая система отпугнет от применения кодеков. Режим для MPEG-4 Part 10 еще не определен, но компания Microsoft уже объявила о том, что не будет вводить плату за факт использования в отношении Windows Media 9 Player.
Одна из причин, чтобы желать ввести оплату лицензирования по принципу "плата за использование" вместо сбора за приемник, может быть, по иронии судьбы, связана с очень успешной деятельностью международных групп по стандартизации, таких, как ISO/IEC JTCI MPEG. В прошлом, когда патентами на систему владела какая-нибудь одна компания, она могла брать с других производителей оборудования плату за использование патентов из расчета некоторой суммы на один приемник, что приносило чистый доход.
Сегодня, когда патентами на открытую стандартную систему владеют многие компании, которые также производят телевизионные приемники, лицензионная выплата из расчета на приемник может означать плату самим себе за право использовать собственную систему. Естественно, они хотели бы найти кого-нибудь еще, кто платил бы, и этот кто-то и есть вещатель с деньгами, которые он получает от пользователей службы или сервиса. Вопрос оплаты за лицензию (за факт использования или в расчете на приемник) зависит от ряда аспектов, например: от того, владеет ли компания патентами, или каким бизнесом она занимается, и т.д. Это может быть важным вопросом в ближайшие годы, и только время поможет найти решение.
Выводы
Какие можно сделать выводы, основываясь на анализе развития кодеков?
Благодарность
При подготовке этой статьи автор использовал многочисленные документы, а также материалы различных дискуссий. Особую благодарность автор приносит Кену Мак-Канну, возглавляющему группу DVB AVC, за его проницательность и профессору Марку Кривошееву за многие ценные советы.
Между прочим разрешите заметить, что к почитателям камеры "ЛОМО" кроме автора, как говорят, относится и Президент Российской Федерации Владимир Путин.
Литература
EBU I34-2002. The potential impact of Flat Panel displays on broadcast delivery of television.
EBU I35-2003. Further considerations on the impact of Flat Panel home displays on the broadcasting chain.
BPN 055. Subjective viewing evaluations of some commercial internet video codecs — Phase 1, May 2003.
Опубликовано: Журнал "Broadcasting. Телевидение и радиовещание" #8, 2003
Посещений: 11374
Автор
| |||
В рубрику "Оборудование и технологии" | К списку рубрик | К списку авторов | К списку публикаций