В рубрику "Оборудование и технологии" | К списку рубрик | К списку авторов | К списку публикаций
Во второй части статьи продолжается ранее начатый разговор о проблемах, которые неизбежно возникнут при конструировании, разработке и внедрении цифрового медиаархива в реальное производство
Модель метаданных: медиаобъекты
Объекты второй группы принято называть медиаобъектами. Они напрямую включают медиаданные, такие как видео, звук, графика, текст/гипертекст и др., и являются теми семантическими единицами, "медиакирпичами", из которых будут складываться объекты первой группы. Сразу же встает вопрос: а насколько малы должны быть кирпичи, те самые семантические единицы? Например, что следует отнести к медиаобъекту - полный новостийный выпуск или единичный сюжет из программы новостей? И то и другое вполне может быть напрямую представлено медиаданными, поэтому признак прямой связи с ними недостаточен для выделения медиаобъектов из общей массы объектов. Можно добавить еще одно часто употребляемое условие - к медиаобъекту должен быть применим стандартный идентификатор SMPTE UMID, но и этого мало.
Для того чтобы принять верное решение, нужно определить, что же, собственно, понимается под моделью метаданных. Важнейшая особенность модели состоит в том, что в ней должны быть обязательно определены отношения между объектами. В этом случае модель метаданных образует структуру, если следовать терминологии теории структур. В качестве поясняющего примера обычно приводят шахматы: там вообще не существует определения шахматных "объектов", таких как шахматная доска, пешки и другие фигуры. В шахматах, где мы имеем дело с "объектами без свойств" (иначе было бы невозможно играть вслепую), определено только то, как шахматные "объекты" соотносятся между собой. В нашем случае объекты могут находиться в отношении подчинения parent/child (в русском варианте мать/дочь, что отражает, наверное, ветхозаветную традицию наследования некоторых признаков по женской линии, но это уже вопрос к этнографам). Медиаобъекты лежат на нижних уровнях иерархии, а, например, эфирное расписание является составным, материнским объектом по отношению к составляющим его дочерним медиаобъектам. Однако медиаобъекты, в свою очередь, являются материнскими по отношению к своим дочерним экземплярам, главное свойство которых - их физическое существование в виде компьютерных файлов и/или на магнитной ленте. К экземплярам медиаобъектов применимы такие характеристики (метаданные), как:
Медиаобъект может быть представлен в нескольких экземплярах, например как MPEG 1 или MPEG 4 - экземпляр низкого разрешения в виде файла, и MPEG 2 - экземпляр вещательного качества на ленте.
Подробное описание общих принципов построения модели метаданных дает Dublin Core Metadata Initiative (http://dublincore.org/). Хорошим примером медиаориентированной модели является модель датского радио DR Metadata Standard (http://www.dr.dk/metadata). Как подчеркивают авторы этих моделей, последние ограничены ядром описания, которое не касается расширенного описания, относящегося собственно к семантике медиаконтента. Вся, так сказать, содержательная часть описания в этих моделях входит в неструктурированную аннотацию. Пример более фундаментальной модели под названием SMEF был предложен Би-би-си.
Модель метаданных: movie-объекты
Аудиовизуальные архивы, являющиеся предметом нашего рассмотрения, имеют некоторые особенности, определяемые специальными - "аудиовизуальными" - типами медиаконтента. Поэтому было бы логичным воспользоваться этим обстоятельством для построения "аудиовизуально-ориентированной" модели метаданных. У таких аудиовизуальных типов медиа, как кино, видео и звук, есть одна важная черта - все они привязаны к временной шкале, к тайм-коду. Поэтому среди всех медиаобъектов разумно было бы выделить аудиовизуальные объекты в отдельный специфический класс, который, следуя терминологии QuickTime, можно было бы назвать классом movie-объектов. Поясним смысл такого выделения.
Во-первых, каждый movie-объект, естественным образом "стоит во главе" иерархии дочерних объектов: movie-объект может распадаться во времени на сцены, сцены - на планы, планы -на кадры, и при этом объекты каждого иерархического уровня должны быть снабжены метаданными, специфическими для данного уровня.
Во-вторых, наоборот, movie-объекты можно монтировать во времени, в частности укладывать на временную шкалу, тем самым создавая новые и порождая другой тип метаданных - лист монтажных решений.
В-третьих, movie-объекты можно синхронизировать по времени, создавая новые "многотрековые" movie-объекты. Принципиальная возможность их синхронизации накладывает особые требования при выборе используемых медиатехнологий. К таким можно отнести QuickTime и MPEG 4 (последний понимается как технология, а не только как кодек).
В-четвертых, поскольку мы работаем с тайм-кодированным movie-материалом, то почему бы описывающим его метаданным тоже не быть тайм-кодированными, например, текстом или гипертекстом? Все это непривычно, однако заметно повышает эффективность поиска. И наконец, последнее. В телевидении есть такое понятие - "синхрон", или "говорящая голова". При его описании принято упоминать, кто и о чем говорит, таким образом есть "автор" синхрона и то, о чем он говорит, то есть "предмет" синхрона. Поэтому мы получаем метаданные уже не просто в виде текста, а как некоторый структурированный комплекс "автор" (кто-что) + "предмет" (о ком-о чем), использование которого существенно повышает эффективность поиска в том смысле, что действительно минимизируются оба типа ошибок поиска.
Модель метаданных: тематические расширения
Вернемся к ранее сформулированной задаче: как строить расширенное описание, ориентированное на определенную семантическую категорию медиа-контента, отделив в ней "новости" от "спектакля"? В ядре модели метаданных категория медиаматериала обычно не учитывается, и вся семантика "втискивается" в свободную, неструктурированную аннотацию. Такова за небольшими исключениями не только российская, но и мировая практика. Все, конечно, хорошо понимают, что структурированное описание куда эффективнее с точки зрения поиска, но то ли руки не доходят, то ли...
Для такого описания можно предложить два прямо противоположных подхода.
Первый - 2500-летней давности, идущий от онтологии Аристотеля, требует полной структуризации метаданных, когда эксперты усилием воли определяют набор метаданных и их отношений. Главный недостаток такого подхода -слишком велика роль человеческого фактора. Общепризнанных стандартов нет, а если обратиться к двум независимым архивистам, то они предложат малосовпадающие друг с другом структурные схемы. При этом нужно учитывать, что этими разными схемами должен будет пользоваться один и тот же потребитель.
При альтернативном подходе предлагается начать с более или менее произвольного описания материала (лучше всего в виде свободного текста), то есть с того, что, как правило, имеется в данный момент в наличии. В одном из самых фундаментальных лингвистических тезисов утверждается, что человек стихийно говорит правильно, но он может неправильно структурировать. Далее подключается академическая наука. Опираясь на свободное описание как на экспериментальный материал, происходит перевод свободного текста в структурированное описание. Для этого существует несколько различных технологий, объединенных под общим названием Text Mining. Одна из таких технологий, в названии которой фигурируют "ассоциативные сети и перенормировки Хопфилда", базируется на статистической обработке текста, хорошо автоматизируема, но умеренно точна. Другая под названием "лингвистическая типология" требует большого "ручного" труда уровня старшекурсников-лингвистов, но при этом дает заметно лучшие результаты.
Главное достоинство "академического" подхода состоит в том, что он дает возможность строить модель метаданных, исходя из экспериментального материала по строгим принципам, без влияния человеческого фактора. Подходы хорошо отработаны и вполне практичны. Более того, по ходу дела можно получить тематические тезаурусы, весьма полезные для поиска. Ведь кто-то будет искать "выпуск от 25 декабря" или "автомобиль", а кто-то закажет поиск "программы от 25 декабря" или "машины". Такие вещи непременно нужно научиться объединять в одно понятие, что и является одной из главных функций тезауруса.
Возможно возражение: предлагаемые подходы потребует больших временных и финансовых ресурсов. Ответ: да, потребуют и это уже происходит. Мировая практика показывает, что для описания, продуктивного с точки зрения поиска, отношение времени, потраченного на описание movie-объекта, к длительности самого movie-объекта достигает 24. Это число - еще одно "глобальное" доказательство правильности выбора функциональности № 1 (см. часть 1 статьи, Broadcasting № 1, 2005).
Форматы медиаданных
Сегодня применяется широкий спектр цифровых форматов в зависимости от области их использования. Для видео - это MPEG 4 "сверхнизкого" разрешения (Интернет), MPEG 1 низкого разрешения (внутрикорпоративный просмотр), MPEG 2 и некоторые другие форматы высокого разрешения (вещание и монтаж).
Наша рекомендация - MPEG 4 в версии ISO/IEC 14496 во всех разрешениях и для различных задач, и не только в силу отношения "качество картинки/поток", но и потому, что MPEG 4 -не только и не столько кодеки, а прежде всего разумно выстроенная медиа-технология, во многом близкая к технологии QuickTime. Главное возражение - MPEG 4 приемлемого качества предъявляет высокие требования к производительности компьютеров из-за сложной "математики", лежащей в основе MPEG 4 ко- и декодирования. Наш ответ - это положение дел "на сегодня". Если же планировать жизнь медиаархива на несколько лет вперед, то следует вспомнить один из законов Мура: производительность и другие компьютерные показатели удваиваются каждые полтора года.
Интеграция
При создании медиаархива интеграцию надо понимать не в том смысле, что приходит телевизионный интегратор и из обилия аппаратуры от разных производителей собирает некий единый комплекс. Задача обсуждаемой здесь интеграции иная: создание единой информационной среды. Предположим, у вас имеется множество информационных систем и архивов с "вавилонским столпотворением" моделей метаданных, множество хранилищ медиаматериалов. Единая информационная среда призвана обеспечить:
Рассматриваемая задача имеет два принципиально разных решения. Одно из них - единая система управления медиаконтентом, логически помещаемая в центре информационного медиа-комплекса. Второе решение - более современное и продуктивное - основано на так называемой шине данных. Это решение позволяет "жить" всем компонентам медиакомплекса такими, какие они есть, но обеспечивает диалог между компонентами и отслеживает события по всему комплексу. Второе решение значительно проще и логичнее первого, что отражается на стоимости и объеме работ как на стадии начальной инсталляции, так и на дальнейших стадиях жизни комплекса, когда речь заходит о его неизбежных модификациях.
В заключение еще раз напомним, что в статье по большей части обсуждались общепризнанные соображения. Если по поводу их пользы нужна ссылка на авторитеты, то, пожалуйста, - Фридрих Ницше утверждал что-то вроде: "Общепринятые истины не в ходу, отчего проистекают многочисленные неприятности". Разумеется, оригинальное утверждение выглядит куда более фундаментально.
ГТРК "Культура"
Виктор Мазо
Опубликовано: Журнал "Broadcasting. Телевидение и радиовещание" #2, 2005
Посещений: 11267
Автор
| |||
В рубрику "Оборудование и технологии" | К списку рубрик | К списку авторов | К списку публикаций