Проблемы оценки качества звуковых сигналов в системах цифрового радиовещания

В рубрику "Оборудование и технологии" | К списку рубрик | К списку авторов | К списку публикаций

Проблемы оценки качества звуковых сигналов в системах цифрового радиовещания

Анатолий Иванчин
ТРК "Эфир"

Олег Попов, Сергей Рихтер
МТУСИ

Рашель Ставиская
РГРК "Голос России"

Одна из целей внедрения цифрового радиовещания - существенное улучшение качества вещания (по сравнению с аналоговым радиовещанием) в традиционных диапазонах волн. Поэтому вопросы обеспечения качества вещательного сигнала у потребителя услуги выходят на передний план. На бытовом уровне качество передачи в среднем оценивается слушателями как приемлемое, но формирование объективной оценки качества передачи вызывает определенные затруднения

Проблема не нова и возникла одновременно с появлением адаптивных аналоговых и цифровых каналов, меняющих свои параметры в соответствии со свойствами сигнала. В таких каналах не сохраняется форма сигнала, но гарантируется субъективно достаточно высокое качество передачи. Однако соблюдение существующих отечественных стандартов (ГОСТ 11515-91 и ГОСТ Р 50757-95) и методик измерений параметров качества, рекомендованных МСЭ-Р и МСЭ-Т (ITU-R Rec. BS.1387-1, ITU-T Rec. P.800 и ряд других), не в полной мере способно гарантировать объективно высокое качество звучания у потребителя услуги.

Как показывает практика оценки качества широкополосного вещательного сигнала [1], существенные искажения в сигнал ЗВ (СЗВ) вносятся не только трактом вторичного распределения программ (цифровым передатчиком), но и составным трактом первичного распределения. В цифровых трактах передачи используется аудиопроцессорная обработка сигнала, также они оснащаются устройствами компактного представления СЗВ, в которых, как известно, сигналы претерпевают существенные изменения. Заметность этих изменений зависит от алгоритма и величины сжатия, а также от типа звуковой программы. Свой вклад, естественно, вносит и тракт эфирного распространения сигнала, особенно если речь идет о канале с многолучевым распространением.

Развитие метрологического обеспечения канала звукового вещания к настоящему времени существенно отстает от технического обеспечения самого канала. Существующие методики оценки качества передачи СЗВ позволяют контролировать сохранение его формы, а современные аналоговые и цифровые каналы, обеспечивая субъективно высокое качество передачи, в принципе ее не поддерживают. Практически в каждом звене канала сигнал адаптивно обрабатывается с изменением формы - с целью согласования его параметров с возможностями канала передачи. В этих условиях пригоден только один способ контроля - субъективно-статистические испытания (ССИ). Попытки формирования аналога субъективной оценки с использованием модели слухового восприятия малоэффективны при попытке оценки реального СЗВ [1, 2].

Анализируя отечественный и мировой опыт, можно сформировать требования к метрологическому обеспечению следующего поколения:

качество передачи должно оцениваться автоматически, на реальном сигнале, без исключения канала из эксплуатации;
контролируемые параметры должны быть устойчивы во времени и независимы от формы сигнала;
сформированная оценка должна быть коррелирована с субъективной.

К настоящему времени для инструментальной (объективной) оценки качества передачи сигнала ЗВ используются несколько способов. Так, МСЭ в 2001 году была принята рекомендация BS. 1387-1 (Method for objective measurements of perceived audio quality), согласно которой измерения проводятся на заранее известных тестовых сигналах, представляющих набор музыкальных и шумовых звуковых сигналов, считающихся критическими. В состав тестовой последовательности входят также отрезки речевого сигнала (длительностью около 16с); общая длительность сигналов не превышает 4 мин., что не гарантирует статистической устойчивости оценок. Так, опыт измерений на реальных звуковых программах показывает, что длительность анализируемого фрагмента сигнала должна, как правило, составлять около 1 часа.

Судя по многочисленным публикациям, метод обеспечивает хорошее соответствие субъективных и инструментальных оценок при оценке алгоритмов компактного представления, использующих ту же модель слуха (MPEG-2 Layer 3, т. е. MP-3). Попытки оценок алгоритмов, построенных на других принципах (MPEG-4 ААС), или алгоритмов аудиопроцессорной обработки сигнала [1] приводили к неадекватным результатам. При оценке всей совокупности искажений, накапливающихся в канале вещания в процессе многократного преобразования сигнала, эффективность метода представляется сомнительной, на что и было указано в работе [2]. Это можно объяснить низкой точностью использованного варианта спектрального анализа (по сравнению с возможностями слухового анализатора) и использованием традиционной модели слухового анализатора, основанной на исследованиях закономерностей восприятия малокомпонентных гармонических или узкополосных шумовых сигналов. Однако закономерности восприятия реального широкополосного звукового сигнала существенно отличаются от используемых в алгоритме. Так, устранение одной из спектральных составляющих в конкретном звуке - несмотря на то, что она находится ниже теоретического порога слышимости, - отчетливо фиксируется слушателями; очень высока чувствительность к фазовым искажениям между составляющих созвучия и т.д.

Слушатель оценивает качество передачи и останавливает свой выбор на какой-то программе исходя из ее интегрального воздействия на длительном временном интервале. Большой выбор программ позволяет практически каждому подобрать себе предпочтительный звуковой фон. Исходный звуковой материал информационно-развлекательных программ во многом совпадает, а различия между программами во многом определяются подбором, последовательностью и обработкой сигнала звукорежиссером и в конечном счете статистическими характеристиками ряда параметров сигнала.

Удобным статистическим параметром для общей оценки изменений сигнала оказалась сигнальная разновидность (ОСМс) относительной средней мощности, представляющей собой отношение реальной мощности сигнала к гармоническому сигналу с амплитудой, равной пиковому значению на длительности наблюдения (выборке). Длительность выборки логично брать соответствующей времени интеграции по громкости (160-200 мс). Любое изменение спектральных составляющих сигнала, по амплитуде или фазе, появление новых, отражается на соотношении между пиковым и средним значениями сигнала. Поэтому изменение статистического распределения ОСМс может быть использовано в качестве интегрального (обобщенного) параметра при экспресс-оценке канала передачи. Достаточно невысокая вычислительная сложность формирования параметра позволяет просчитать такую оценку в реальном времени.

Мерой оценки изменений сигнала, наиболее адекватной заметности, оказалось интегральное отклонение (ИО) одной нормированной частоты появления значений (НЧПЗ) конкретного параметра от другой. Мощность сигнала "ошибки", т. е. величина ИО, в характере двух распределений ОСМ служит критерием "заметности" изменений сигнала. Пример распределения частот появления значений ОСМ до и после внесения в сигнал искажений приведен на рис. 1.

Интегральные отклонения распределений ОСМс были рассчитаны и нормированы по критерию "заметность изменений сигнала" (табл. 1) для весьма объемного звукового материала, использованного при проведении ССИ группой И.Е. Горона в МЭИСе (ныне МТУСИ) при формировании ГОСТ 11515.

Характерно, что почти во всех современных каналах заметность изменений сигнала - как за счет аудиопроцессорной обработки, так и компактного представления - столь велика, что этот критерий не может быть использован полноценно. Поэтому целесообразен переход к балльной оценке качества. В этом случае шкалирование оценок производилось по усредненным опубликованным результатам многочисленных ССИ качества сигнала в формате МРЗ (табл. 2).

При необходимости проведения более тонких измерений (например, для выявления звеньев канала, вносящих наиболее заметные искажения в сигнал) может быть дополнительно использован ряд других статистических параметров СЗВ. Прежде всего, это ОСМк (канальная разновидность ОСМ, получаемая путем нормирования ОСМ к мощности гармонического сигнала, номинального для данного канала) - параметр, оценивающий степень использования канала по мощности, что при ССИ хорошо соответствует громкостной оценке.

Известна также высокая информационная ценность начального участка отдельного звука - атаки и высокая чувствительность слуха к ее изменению. Изменения в характере нарастания сигнала замечаются на длительности 0,2 мс. В качестве параметра оценки переднего фронта может быть принята средняя крутизна фронтов. Существенное влияние на восприятие сигнала оказывает и характер его спада - крутизна заднего фронта, определяемая в основном реверберационными характеристиками помещения, в котором производится запись сигнала.

Наиболее привычным параметром субъективной оценки является тембр, определяемый характером огибающей амплитудного спектра сигнала. В современных каналах с устранением избыточности к линейным искажениям АЧХ канала добавились нелинейные -исчезновение части спектра, как бы "не воспринимаемого" слушателем. Для фиксации отличий мгновенных спектров разработана методика формирования оценок на отрезках небольшой длительности с точностью, приближенной к точности слухового анализатора [1]. Такие изменения спектра существенно снижают общую гармоничность сигнала, которая оценивается дисперсией мгновенных спектров и его кепстральной оценкой. (Кепстр - результат повторного БПФ-преобразования трансформированной огибающей амплитуд ного спектра сигнала.) Чем более гармоничен сигнал, тем выше пик-фактор кепстральной оценки. Например, пик-фактор кепстра Н. Баскова будет существенно выше, чем у Г. Сукачева. Для человеческого организма полезны воздействия гармонических сигналов, поэтому подсознательно слушатели выбирают для создания звукового фона радиопрограммы с интегрально более гармоническими сигналами. К снижению пик-фактора кепстра приводит и снижение разрядности представления сигнала в критических полосках слуха при его компактном представлении.

Существенное влияние на восприятие СЗВ оказывает и его ритмическая структура, которая также претерпевает изменения при прохождении канала, особенно при аудиопро-цессорной обработке сигнала. Одним из параметров, который возникает целиком по вине вещателей, является придыхание. Уровень придыхания для здорового человека составляет -20...-30 дБ. После прохождения канала уровень повышается иногда до -6 дБ, что заставляет слушателя беспокоиться о здоровье говорящего (не астма ли у него?).

Согласно методу, в аппаратно-программном комплексе (спектроанализаторе) осуществляется вычисление, построение и анализ статистических характеристик параметров СЗВ, а также изменений этих характеристик на основе сравнения искаженного в канале и исходного сигналов. Отклонения распределений от поля (то есть совокупности) нормированных значений параметров определяют характер вносимых каналом искажений с учетом вероятности их появления и субъективной за-метности, вне зависимости от способа представления и обработки сигнала в канале передачи. Разработанный в МКСО набор шкал позволяет, дополняя уже существующие методики измерения параметров канала [1], проводить объективные измерения на всех типах каналов, используемых в трактах первичного и вторичного распределения. Реализация метода предполагает компьютеризацию процесса измерений, что обеспечивает возможность автоматизированного объективного контроля качества трактов передачи по конечному эффекту - качеству воспринимаемого на слух сигнала звукового вещания.

Во многих случаях весьма значительные изменения в сигнал вносятся целенаправленно для повышения предпочтительности сигнала для слушателя. Параметр ОСМс хорошо коррелирован с характером психофизиологического воздействия музыкальных программ на слушателя по шкале "возбуждение - торможение". Как показали исследования [1], большинство слушателей предпочитает вещательные программы с нейтральным воздействием. По результатам исследования параметров сигнала, передаваемого десятью популярными в Москве радиостанциями, была сформирована таблица предпочтительных параметров (табл. 3).

На базе ТРК "Эфир" (г. Москва) и радиоцентра МРЦ ФГУП "РТРС" (г. Талдом) в 2007 г. были проведены измерения на канале, вещающем программы РГРК "Голос России" в формате DRM. Цель эксперимента - проверка на практике методик объективной оценки качества вещательного сигнала как с использованием тестовых сигналов, рекомендованных МСЭ-Р, так и на основе МКСО. Для осуществления этого плана была разработана методика измерений [3], для реализации которой произведена цифровая запись в wav-формате тестовых сигналов и звуковых программ одновременно в нескольких точках радиовещательного канала - от выхода эфирной студии в Москве до выхода DRM-при-емника в районе г. Кельна. В качестве примера на рис. 2 показаны сигналы на входе передатчика и выходе приемника.
При формировании оценки по методике ITU и в процессе компактного представления МРЗ используется одна и та же модель восприятия сигнала, что обеспечивает его относительную эффективность на этом участке. Но и в этом случае не учитывается статистическая устойчивость оценки, которая может быть получена только на большом интервале наблюдения. В сложном составном реальном канале даже полезные изменения сигнала, повышающие оценку качества передачи слушателем, будут оцениваться как нежелательные. Применение МКСО для анализа 16-секундных фрагментов речевого сигнала базы МСЭ-Р также не способствовало повышению этой оценки.

Ниже представлены некоторые результаты расчетов в рамках МКСО ряда статистических параметров СЗВ для разных участков канала ЗВ. Так, на рис. 3 показаны изменения интегрального параметра ОСМс в тракте первичного распределения, а на рис. 4 - изменение величины ИО ОСМс в процессе передачи сигнала. Можно предположить, что основные изменения в сигнал вносятся трактом первичного распределения.

С помощью табл. 1, 2 и 3 проведенные измерения позволили спрогнозировать оценку качества передачи слушателем по критериям "заметность", "балльная оценка" и "предпочтительность". Результаты сведены в итоговую табл. 4.

Рассмотрим характер изменения отдельных параметров сигнала в канале ЦРВ. На всех стадиях предварительной обработки вещательного сигнала обычно стремятся к увеличению параметра ОСМк. Однако, несмотря на добротную подготовку сигнала в тракте формирования программ (рис. 5), на участке от тракта формирования до входа передатчика наблюдается существенное снижение ОСМк. В то же время на участке вход передатчика - выход приемника ОСМк сигнала несколько увеличивается, в основном за счет входного АРУР и ограничителя передатчика.

Изменения характера нарастания и спада определяются в основном АРУР и звеньями с компактным представлением сигнала, особенно при использовании полосовой фильтрации, вызывающей затягивание фронтов (рис. 6).

Любая обработка со сжатием динамического диапазона приводит к увеличению крутизны фронтов, в то же время компактное представление сигнала с полосовой фильтрацией приводит к затягиванию и выравниванию переднего и заднего фронтов (рис. 7). При нескольких последовательных преобразованиях с использованием компактного представления крутизна фронтов уже определяется в большей степени свойствами фильтров, а не исходного сигнала.

Кепстр, оценивающий степень гармоничности сигнала, параметр, очень чувствительный к способам компактного представления с использованием маскировки шумов и искажений самим сигналом. Такие изменения практически невозможно выявить другими методами. В тракте первичного распределения изменения пик-фактора кепстра минимальны, хотя изменения сигнала по другим параметрам весьма значительны (рис. 8). В то же время на участке до приемника при минимальных изменениях остальных параметров кепстральные оценки изменяются существенно. Как уже отмечалось, подсознательно слушатель предпочитает более гармоничные сигналы.

Дисперсия мгновенных спектров (рис. 9) вычисляется как отклонение коэффициента передачи от среднестатистической тенденции (в идеале единичной). При компактном представлении с устранением избыточности часть спектральных составляющих сигнала отбрасывается как "не воспринимаемая слушателем". При расчете АЧХ-тракта передачи это отображается в виде дисперсии оценок, которая тем больше, чем выше коэффициент сжатия сигнала. Анализ результатов ССИ показал, что увеличение дисперсии оценок пропорционально снижению оценки качества передачи слушателем. Очевидно, что вносимые искажения болезненно воспринимаются слушателями. Сама среднестатистическая тенденция сравнительно равномерна и довольно близка к шаблону для второго класса, что обеспечивает сохранение тембральной окраски сигнала.

Величина сигнала придыхания и ритмические характеристики СЗВ в канале ЦРВ практически не изменились.

Сравнительный анализ параметров сигнала на входе и выходе канала передачи позволяет сформировать объективную оценку качества передачи, хорошо совпадающую с результатами субъективно-статистических измерений по всем критериям (табл. 4). Эта работа была выполнена в процессе обработки результатов эксперимента с использованием отрезков реального сигнала длительностью около 30 мин. При проведении сравнительной оценки сигналов на входе и выходе тракта они были нормализованы по уровню и полосе передаваемых частот.

Анализ приведенных данных позволяет сделать следующие выводы.

Значительные изменения сигнала при передаче по каналу в целом, по методике МСЭ-Р, скорее всего, будут оценены как недопустимые, методика МКСО позволяет оценить как соответствующие второму классу качества передачи (это соответствует каналу с полосой эффективно передаваемых частот около 6300 Гц), со снижением качества приблизительно на 1,2 балла и находящиеся по параметрам близко к предпочитаемым слушателями.
Основной недостаток методики МСЭ-Р состоит в попытке формирования обобщенной оценки на основе анализа изменений скудного набора простейших звучаний с использованием модели, адекватной только в случае восприятия гармонических сигналов и узкополосных шумов.
Полученные результаты подтверждают эффективность передачи сигнала ЦРВ в СЧ- и ВЧ-диапазонах в формате DRM и, надеемся, должны послужить дополнительным стимулом к применению МКСО - прежде всего для экспресс-оценки качества вещания по реальному сигналу непосредственно в процессе радиопередачи.

Литература

Попов О.Б., Рихтер С.Г. Цифровая обработка сигналов в трактах звукового вещания. Учебное пособие для вузов. - М.: Горячая линия - Телеком, 2007. 341 с.
Бабуров П.В., Попов О.Б., Рихтер С.Г. Анализ известного метода объективного контроля качества звуковых вещательных сигналов // МФИ-2006. Труды конференции "Телекоммуникационные и вычислительные системы". - М., МТУСИ, с. 64-65
Попов О.Б., Рихтер С.Г., Ставиская P.M. О методике оценки качества передачи вещательного сигнала при проведении опытного радиовещания в формате DRM // МФИ-2006. Труды конференции "Телекоммуникационные и вычислительные системы". - М., МТУСИ, с. 88-90

Опубликовано: Журнал "Broadcasting. Телевидение и радиовещание" #8, 2007
Посещений: 19637

Автор