Контакты
Подписка
МЕНЮ
Контакты
Подписка

Организация звукового канала для вещания

В рубрику "Коммутационно-распределительное оборудование, аксесуары" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Организация звукового канала для вещания


Сергей Теллин
Руководитель департамента радиовещания
компании Audio Solutions (ООО "Звуковые решения")

Данная статья является попыткой "общего" ответа на вопросы начинающих радиовещателей о технологиях передачи звука. Речь также пойдет о современных интерфейсах, кодирующих форматах и приборах для передачи звука на большие расстояния. Очевидно, что рамки статьи не позволяют всесторонне осветить существующие проблемы. Впрочем, им посвящено немало книг, поэтому задачей автора данной статьи было "широкими мазками" обрисовать основные аспекты этих проблем

Преодоление расстояния, или Через тернии к...

В современном мире, в больших и средних городах часто возникает ситуация, когда студия и передатчик (передающий центр) удалены друг от друга. Каким образом можно устранить связанные с этим препятствия с минимальными затратами, сохранив максимальное качество вещания?

Старый, но, впрочем, все еще распространенный способ "закинуть далече" аналоговый сигнал, максимально "разогнав" его по выходному уровню и компенсировав "особенности передачи" длинной линии эквалайзерами, не вызывает священного трепета, тем более когда речь идет о новых технологиях. С другой стороны, решения всегда принимаются с учетом местных специфических обстоятельств.

Преодоление дистанции до 200 м между студией и передатчиком не вызовет ни у кого никаких вопросов.

Аналоговый сигнал без проблем преодолеет такое расстояние по хорошему симметричному кабелю. Справедливости ради нужно отметить один из видов помехозащищенного аналогового кабеля - Starquad. Это специальная конструкция кабеля, предназначенная для эксплуатации на длинных дистанциях и в условиях "тяжелых" помех. Ее особенностью является то, что на один канал приходится не 3 провода ("горячий" + "холодный" + "земля"), а 5 (2 "горячих" + 2 "холодных" + "земля") — за счет этого помехи, возникающие при большой длине кабеля, исчезают.

Цифровой же сигнал формата AES/EBU (110 Ohm) без проблем "пройдет" до 150 м, причем только при условии соответствующего толстого цифрового кабеля. Исключение составляют форматы SP/DIF и AES-3, которые способны донести сигнал без потерь на расстояние до 500 м (в определенных условиях и специальном кабеле).

Абсолютно без потерь будет доставлен сигнал по оптическому одномодовому или многомодовому волокну. В отличие от первых двух вариантов, где провода соединяют конечное оборудование, для передачи звука по оптическому волокну понадобятся дополнительные конвертеры (преобразователи), с одной стороны, электрических сигналов в оптические, с другой — оптических сигналов в электрические.

Многочисленность решений позволяет удовлетворить практически любые потребности вещателей для передачи звука (аналогового и цифрового); звука и управления (Ethernet/Serial/USB); звука, управления и видео (SDI & HD-SDI/Composite Vi-deo/RGB/VGA/DVI).

Используя специальные технологии (в частности, оптическое мультиплексирование), можно объединить до 8 цифровых звуковых стереоканалов в одно оптическое волокно (нитку). Интересно также и то, что оптическое волокно позволяет доставить некомпрессированный сигнал без потерь на расстояние от 3 (многомодовое волокно) до 40 (одномодовое волокно) километров!

Возможности вокруг нас

К сожалению, возможность воспользоваться прямым звуковым или оптическим кабелем существует не везде. И тогда в городах с развитой инфраструктурой на помощь вещателям приходят специалисты телекоммуникационных услуг (провайдеры). Они выполнят ту же задачу — свяжут воедино (скроссируют) две географически удаленные точки, для того чтобы между студией и передатчиком появился (пусть даже виртуально) прямой канал.

Что может заинтересовать вещателя из всего многообразия предлагаемых провайдерами услуг?

  • Соединение "точка — точка" по медной паре или по оптическому кабелю. Если прокладывать прямой физический кабель нет возможности или это очень дорого, то будут использованы кросс-соединения, то есть несколько кабелей, последовательно соединенных друг с другом в "один" длинный. В таких случаях применяются так называемые "прозрачные каналы" с интерфейсами X.21/V.35, E1/G.703. Звук кодируется и декодируется звуковыми кодеками в поток данных и передается в транспортной SDH-среде (Synchronous Data Hierarchy) — рис. 1. SDH является европейским стандартом для использования оптических кабелей в качестве физической среды передачи данных для скоростных сетей передачи на значительные расстояния.

Также к типу соединений "точка — точка" можно отнести ISDN (Integrated Services Digital Network) — временное гарантированно-качественное цифровое соединение. Но необходимо отметить, что этот международный телекоммуникационный стандарт для передачи голоса, данных и сигналов управления по цифровым линиям, опутавший своими сетями всю Европу и Америку, очень слабо развит в "аналоговой" России, и присутствует только в крупных городах. К тому же с развитием IP-технологий этот тип соединений потерял свою востребованность.

  • Радиорелейные линии, использование которых не только требует наличия определенных разрешений, но и оправданно в основном в той местности, где нет возможности использовать кабельные коммуникации (например, в горах).
  • IP-протокол, который также применяется для передачи звука. Многие вещатели с опаской относятся к IP (Internet Protocol). Возможно, это происходит из-за некоего предубеждения против стандартного Ethernet-кабеля, по мнению некоторых, малопригодного для звука.

Однако IP-технологии все чаще применяются для передачи не только звука, но и видеопотоков, которые значительно объемнее звуковых каналов. Чтобы чуть-чуть прояснить ситуацию вокруг такого "страшного" и неизвестного многим IP-интерфейса, стоит отметить, что протокол TCP/IP (Transmission Control Protocol/ Internet Protocol — привычный многим термин) к звуку отношения не имеет, а относится исключительно к Интернет-технологиям, таким как e-mail (электронная почта), Web (непосредственно Интернет), FTP (протокол передачи файлов).

Для работы со звуком применяются только коммутируемые Ethernet-сети, что позволяет справляться со значительными нагрузками в сети и снижать сетевые задержки, к которым очень чувствительны звуковые каналы. Важно и то, что в коммутируемых сетях все пакеты, поступающие от приложений, могут подвергаться классификации, фильтрации и обслуживаться сетью в соответствии с установленными правилами. Это определяется QoS (Quality of Service, или качество обслуживания) — сетевой архитектурой, позволяющей контролировать такие параметры передачи трафика, как задержка, колебания задержки и потери пакетов в сети.

Звуковые потоки не допускают задержку или остановку передачи, так как в противном случае это приведет к появлению искажений в принимаемом звуковом сигнале.

Звуковая информация в IP-сети, как и все остальные виды данных, передается в виде пакетов. Ввиду чувствительности звуковых приложений к задержкам эти пакеты обрабатываются с наивысшим приоритетом и имеют необходимые "флажки" (опознавательные знаки). Офисные же приложения включают в себя механизмы повторной посылки потерянных пакетов, и время сетевой задержки для них не играет никакой роли.

Современные сети снабжены механизмами, которые могут отличать, трафик какого приложения передается в данный момент, и на основании этого принимать решение о том, как его передавать: задержать в буфере или обеспечить ему, имеющему флажки, "зеленый коридор".

Передача звука в IP-среде происходит в следующих протоколах:

  • UDP (User Datagram Protocol);
  • RTP (Realtime Transport Protocol);
  • RTCP (Real Time Control Protocol);
  • RTSP (Real Time Streaming Protocol) и других.

Именно эти протоколы совместно с QoS дают возможность минимизировать сетевые задержки и устранять непредсказуемость этих задержек. Интересной особенностью IP-передачи является и то, что из одной точки (А) можно "раздать" звуковой сигнал в множество других точек (B, C, D, E и т.д.) — это режим Multicast (рис. 2).

Особо хочется предупредить о нежелательности использования протокола VPN (Virtual Private Network), который часто предлагается провайдерами для передачи данных. Относительная дешевизна протокола, рассчитанного на офисные приложения, "аукнется" в передаче звука большими задержками (измеряемыми секундами) и большими потерями информационных пакетов (до 40%!), что в свою очередь вызовет необходимость увеличить ширину канала (на те же 40-50%).

Для "особо критичных приложений"

Справедливости ради нужно отметить, что большинство звуковых кодеков "умеют" работать со всеми стандартными интерфейсами связи. Хорошие кодеки имеют возможность функционировать параллельно в нескольких интерфейсах. Очень хорошие кодеки разработаны для "особо критичных приложений" (Mission critical application): за счет резервирования блоков внутри единой системы возможные сбои не могут губительно повлиять на работу приемопередающей системы.
Главное отличие разных кодеков состоит в применяемом формате кодирования (компрессии) звука, но об этом чуть позже.

Важно помнить, что в случае построения канала необходимо резервировать свою "последнюю милю", то есть расстояние от студии (и передатчика) до "точки присутствия" провайдера. Линии связи крупных операторов имеют автоматическое резервирование каналов передачи данных. "Последняя миля" может быть зарезервирована только по желанию вещателя, так как эта процедура связана с дополнительными расходами. Также следует учитывать, что резервирование имеет смысл только в том случае, когда резервные кабели уходят в геометрически удаленное направление к основному кабелю.

Звук в... цифрах

Для того чтобы понять, как звук будет передаваться в дальнейшем, нужно вспомнить, что звук представляет собой в цифрах.

Стандартные звуковые параметры:

44 100 (Гц) х 16 (бит) = 705 600 (бит/с) х 2 = 1 411 200 (бит/с)
48 000 (Гц) х 16 (бит) = 768 000 х 2 = 1 536 000 (бит/с)
48 000 (Гц) х 24 (бит) = 1 152 000 х 2 = 2 304 000 (бит/с)

Стоит обратить внимание и на параметры цифровых интерфейсных каналов:

X.21/V.35 — от 64 000 до 2 048 000 бит/с
E1/G.703 — 2 048 000 бит/с
ISDN — от 64 000 до 2 048 000 бит/с
IP — практически без ограничения, в настоящее время 1 Гбит (1 000 000 кбит/с)

Для извлечения практической пользы из "голых" цифр нужно обратить внимание на стоимость ввода в эксплуатацию и ежемесячные затраты на различные цифровые каналы.

Самым дорогим по стоимости является решение на E1/G.703. Безусловно, это решение еще и самое надежное. Оно имеет минимальное время задержки в передаче данных (даже в таком большом городе, как Москва) — около 3-5 мс.

Следующими в "ценовом ряду" являются "прозрачные каналы" X.21/V.35 — два интерфейса с некоторыми отличиями между собой. Время задержки звука то же. Правда, следует учитывать, что ко времени задержки для передачи "из точки А в точку Б" в каждом рассматриваемом варианте добавится время кодирования и декодирования звука в аудиокодеках.

Самым демократичным по стоимости в настоящий момент является IP-решение. Правда, время задержки в данном случае может составить от 30 мс и более. Каким бы странным это не показалось, но использование технологии Multicast позволяет значительно сократить затраты на одновременную передачу звуковой информации в несколько разных мест (и/или городов).

Технологии звукового сжатия

Как только разговор заходит о передаче более качественного звука, чем звук с параметрами 44 100 Гц / 16 бит, или о передаче нескольких звуковых программ в одном интерфейсном канале для передачи, сразу возникает вопрос об уплотнении звука, то есть, попросту говоря, о компрессии.

По существу, мир звукового сжатия разделен на две части:

  • MPEG и его производные, чаще называемые "психоакустическими" алгоритмами;
  • алгоритм ADPCM.

Самым известным форматом кодирования, безусловно, является MPEG. Заглянув в историю, мы увидим как еще с начала 1988 г. началась уникальная работа связанного с этим форматом международного движения, которая с успехом продолжается и развивается до сих пор.

Правда, если обратить внимание на само название этого движения (MPEG — Motion Pictures Expert Group), то станет ясно, что вопросом кодирования звука занимались в первую очередь эксперты-телевизионщики, для которых звук - это сопровождение картинки. Работа MPEG-кодера со звуком до сих пор оставляет желать лучшего, особенно на низких битрейтах. Видимо, поэтому в настоящее время появляются все новые и новые форматы звуковой компрессии MPEG. На смену MPEG Layer 2, профессионально используемому стандарту, приходят новые поколения: Layer 3, Layer 4, Layer 7.

Про MPEG сказано и написано немало и очень подробно. Но, к счастью, не только MPEG единым жив технический прогресс.

Альтернативный алгоритм для радио

Одним из известных форматов, заслуживших уважение радиовещателей всего мира, является формат apt-X, базирующийся на использовании принципа работы алгоритма ADPCM (Adaptive Differential Pulse Code Modulation) с разделением всей частотной полосы аудиосигнала на несколько раздельных частотных полос. ADPCM — это технология, которая перекодирует не весь аудиосигнал, а только разницу между двумя цифровыми звуковыми образцами (сэмплами), используя пошаговую квантизацию (step-sizes), которая в свою очередь адаптируется к энергии входного аудиосигнала. Таким образом, ADPCM предоставляет качество звука, аналогичное линейному PCM (Pulse Code Modulation), но со значительно меньшей скоростью передачи данных. Система кодирования apt-X рассчитана на кодирование стандартного 16-битного линейного звукового сигнала с фиксированным коэффициентом компрессии 4:1. Важным фактом является и то, что время задержки кодирования/декодирования звука при использовании частоты дискретизации 48 000 Гц составляет всего 2,5 мс! Существуют три ключевых элемента apt-X-алгоритма, которые в комплексе обеспечивают передачу данных без потери качества звука:

  • многополосное кодирование;
  • линейное предугадывание;
  • адаптированная квантизация.

Многополосное кодирование алгоритма apt-X разделяет звуковой сигнал на четыре полосы частот, которые обрабатываются отдельно. Путем изменения разрешающей способности краткосрочного кодирования по каждой полосе в соответствии с мощностью сигнала определяется спектральный избыток в широкополосном звуковом сигнале.

Линейное предугадывание базируется на кратковременном анализе восстановленных предыдущих сэмплов. Оно необходимо для того, чтобы изъять спектральный избыток из сигнала в каждой из четырех частотных полос. Избыток снижается путем сравнивания уровня входящего сэмпла с предугадыванием, которое создает алгоритм для этого сэмпла. Технология обеспечивает идентичное "упреждение" декодера и кодера без необходимости передачи любой дополнительной информации. Алгоритм кодирования apt-X оптимально соответствует восприятию человеческого уха. Избыток, который убирается из кодирующего устройства, фактически будет добавлен в декодирующее.

Адаптированная квантизация вырабатывает сравнительно медленные разновременные энергетические изменения, которые обеспечиваются постоянным сравнением и подстраиванием квантизационного пошагового размера (step-size) к сигнальному уровню. Step-size определяется анализом предыдущего квантизационного step-size-шага. Эффективность квантования напрямую зависит от уровня сигнала и его изменения во времени в каждой частотной полосе. Эта особенность квантования создает феномен временного маскирования, когда пики импульсных звуковых сигналов на длительный период времени маскируются другими ранее или позднее появившимися звуковыми сигналами. Эффективность квантования сигналов, звучащих сразу после импульсных звуков, может быть снижена без слышимого эффекта.

В борьбе за улучшение качества звука

Так выглядит "технологическая картина" современных решений в области передачи звука в различных форматах. Надеюсь, что не перегрузил читателя техническими терминами и обозначениями многочисленных интерфейсов, но в то же время уверен, что внимательно прочитавший эту статью специалист сможет четко сформулировать требования, которые необходимы для правильной организации звукового канала в его ситуации, с учетом местных специфических обстоятельств.

Вся жизнь радиовещателей проходит в борьбе за улучшение качества звучания радиостанции. Множество очевидных и неочевидных, явных и неизвестных до своей поры вопросов ждут их на этом пути. Слагаемые успеха — это не только отличная команда и замечательное оборудование в студии, но и правильно выбранный по алгоритму компрессии кодек. Прозрачность канала должна быть обеспечена не только в технологическом решении, но и в самом звуке, не окрашивающем и не искажающем результат кропотливой работы всего творческого коллектива, начиная от актера и звукорежиссера, принимавших участие в записи звукового материала, и заканчивая выпускающим редактором или ди-джеем. В постоянно изменяющемся и технически совершенствующемся мире выбирайте правильное оборудование и звуковые решения, которые позволят не только спокойно работать вам, но и получать удовольствие от вашей работы вашим слушателям.

Опубликовано: -2005
Посещений: 19103

  Автор

Сергей Теллин

Сергей Теллин

Руководитель департамента радиовещания
компании Audio Solutions (ООО "Звуковые решения")

Всего статей:  2

В рубрику "Коммутационно-распределительное оборудование, аксесуары" | К списку рубрик  |  К списку авторов  |  К списку публикаций