Обзор потоковых аудио- и видеопродуктов для WEB
Для конечных пользователей аудио и видео - самые новые носители информации в Web. Для авторов содержательных материалов, распространяемых по Web, - это мощные инструменты, позволяющие привлечь и удержать внимание капризной аудитории.
World-Wide Web избавилась от немоты и статичности. Новые технологии принесли в однообразный мир HTML-текста звук, видео- и мультипликацию. Будучи наиболее совершенным средством распространени информации (или способом для администраторов серверов создавать неотразимо привлекательные хиты), мультимедиа в Web оказалась теперь на переднем крае технического прогресса. Предлагаемый вашему вниманию обзор из двух статей показывает, что сулят нам аудио- и видеовозможности Web, и как мы можем их использовать.
- Преобразование мультимедиа-файлов в цифровую форму.
На первом шаге аналого-цифровое преобразование информации от аудио- или видеоисточника, обычно для этой цели используютс стандартная звуковая плата, плата регистрации (фиксации) изображения или обе платы вместе. В процессе сжатия помехи не отфильтровываются, поэтому необходимо позаботиться о том, чтобы сигнал, поступающий на кодер, был как можно более чистым.
- Кодирование мультимедиа-файлов.
Все потоковые аудио- и видеотехнологии сжимают поток данных с тем, чтобы сделать возможной его передачу по линиям связи с пропускной способностью 14,4 кбит/с (9,6 кбит/с для аудио) в реальном масштабе времени. Чтобы представить информацию в уникальном формате сжати каждого поставщика, программы кодирования используют собственные алгоритмы сжатия, допускающие некоторые потери информации.
- Встраивание мультимедиа-файлов в страницу Web.
Автор Web вставляет указатель в стандартный тег HTML в странице Web. Указатель обеспечивает связь с файлом-указателем (token file) на мультимедиа-сервере. Файл-указатель содержит информацию о типе и местоположении самого мультимедиа-файла.
- Интеграция мультимедиа-файлов в среду сервера.
Чтобы обрабатывать поток информации, Web-сервер должен уметь распознавать многочисленные форматы мультимедиа. Для этого расширение файла регистрируется на сервере в качестве типа MIME (Multipurpose Internet Mail Extensions - расширени многоцелевой почты сети Internet). Несколько потоковых аудиотехнологий и обе видеотехнологии, протестированные нами, также имеют специальные серверные программы, которые нужно конфигурировать и инициализировать.
- Инсталляция мультимедиа-проигрывателя.
Прежде чем отправить запрос на потоковый мультимедиа-файл, вы загружаете из сети и инсталлируете мультимедиа-проигрыватель, предназначенный дл использования в рамках данной технологии. Затем вы регистрируете проигрыватель в качестве вспомогательной прикладной программы своего Web-браузера (это может быть сделано автоматически в процессе инсталляции). Если проигрыватель отсутствует или неверно сконфигурирован, то при попытке обратиться к мультимедиа-объекту браузер предложит вам сконфигурировать проигрыватель.
- Запрос мультимедиа-объекта.
Когда вы щелкаете мышью на мультимедиа-указателе, браузер отправляет на сервер запрос, в ответ на который на ваш ПК пересылается файл-указатель. Этот файл заставляет браузер обратиться к соответствующему проигрывателю, который получает подробную информацию о нужном вам мультимедиа-файле. После того как проигрыватель начнет работать, он посылает запрос на мультимедиа-сервер, который в свою очередь передает данные проигрывателю. По истечении нескольких секунд, необходимых для буферизации, начинаетс воспроизведение файла.
Потоковые (streaming) аудиотехнологии для Web существуют и работают. Для некоторых информационных узлов наиболее подходящее решение может оказаться даже бесплатным.
Звук неотразимо притягивает наше внимание, порой именно звук не позволит вам покинуть только что обнаруженный сервер Web. Но если для того, чтобы прослушать отрывок мелодии, придется сперва целиком загрузить из сети объемистый файл, то у многих ли хватит терпения дождаться конца этой процедуры?
К счастью, новые потоковые (continuous delivery) аудиотехнологии помогут немедленно удовлетворить интерес к звучащей информации, чего и ждет большинство тех, кто странствует по Web. Потоковые технологии начинают воспроизведение сообщения после короткого периода буферизации и продолжают его до конца. Некоторые из них располагают функциональными средствами, похожими на органы управлени видеомагнитофона, такими, как поиск, перемотка вперед и назад. Потоковые технологии, обладая способностью намного более своевременного отклика на внешние воздействия, нежели старые методы, сначала загружавшие файл из сети, а потом воспроизводившие его, дают конечным пользователям ощущение непосредственного участия в происходящем, а авторам Web - возможность удержать внимание аудитории, которой всегда достаточно лишь одного щелчка мышью, чтобы оказаться на соседнем сервере.
В данном обзоре мы рассматриваем пять основных потоковых продуктов, имеющихся в сегодняшней Web: Internet Wave 1.0 фирмы VocalTec; RealAudio фирмы Progressive Networks; StreamWorks фирмы Xing Technology Corp.; ToolVox for the Web фирмы Voxware и TrueSpeech Internet фирмы The DSP Group. Хотя наши тесты показали, что ни один из этих продуктов нельзя признать идеально подходящим для любой ситуации, тем не менее мы убедились, что звуковые эффекты в Web - вполне жизнеспособная реальность.
Потоковые аудиотехнологии предназначены для того, чтобы преодолеть фундаментальную проблему ограниченности полосы пропускания каналов связи, стоящую перед средствами мультимедиа, распределенными по всей Web: Хотя ваш 28,8-кбит/с модем или 128-кбит/с соединение ISDN могут казаться головокружительно быстрыми, они выглядят весьма жалкими в сравнении со старым односкоростным накопителем CD-ROM, способным передавать 150 Кбайт информации каждую секунду.
Хотя большинство из нас мыслит в байтах (или килобайтах), мир коммуникаций все еще имеет дело с битами, которых насчитывается по восемь в каждом байте. Ваш модем, имеющий быстродействие 28,8 килобит в секунду (28,8 кбит/с), обеспечивает пропускную способность около 3,6 килобайт (3,6 Кбайт) в секунду и примерно в 40 раз уступает быстродействию односкоростного накопителя CD-ROM, который вы выбросили на свалку еще в прошлом году. Воспроизведение звука с качеством компакт-диска требует передачи со скоростью примерно 176 Кбайт данных в секунду, что почти в 50 раз превосходит возможности 28,8-кбит/с модема. По этой причине во всех потоковых аудиотехнологиях поток звуковой информации сильно сжимают с тем, чтобы совместить его с пропускной способностью вашего соединения Internet, которая может составлять всего лишь 9600 бит/с.
Все потоковые средства передачи звука представляют собой кодеки (кодеры/декодеры), состоящие по меньшей мере из двух компонентов: модуля сжатия (или кодера), сжимающего поток звуковой информации, и модул восстановления (или проигрывателя), восстанавливающего и воспроизводящего сжатый аудиопоток. Роль третьего компонента играет предложенное фирмами Progressive Networks и Xing Technology специализированное серверное программное обеспечение. Программы доставляют звуковые потоки клиентам либо наделяют проигрыватель новейшими функциональными средствами или делают и то и другое.
Кодеры чаще всего представляют собой автономные продукты, выполняющие одну простую задачу: сжать поток звуковой информации, чтобы вместить его в ограниченные рамки узкополосных каналов связи, используемых для доступа к Internet. Применяемые во всех потоковых продуктах методы, допускающие потери (lossy techniques), дают возможность получить необходимый высокий коэффициент сжатия; это означает, что в процессе воспроизведения не происходит точного восстановления исходного файла. Вместо этого кодек в процессе сжатия заменяет подлинные данные их более компактным представлением. Во время воспроизведени кодек восстанавливает информацию в файле, базова структура которого приблизительно соответствует подлиннику, но не является его точной копией.
Все алгоритмы сжатия с потерей исходных данных, независимо от того, предназначены они для звука, статических изображений или видеоклипов, имеют одну общую характеристику: чем больше коэффициент сжатия, тем выше уровень вносимых искажений. Очевидно, при сравнении потоковых аудиокодеров следует выяснить, какая технология вносит наименьшие искажения при одинаковом коэффициенте сжатия, т. е. определить, какой метод обеспечивает лучшее звучание во врем воспроизведения.
Для оценки качества воспроизведения мы сжимали файлы двух типов, речевые и музыкальные, для двух целевых значений полосы пропускания, 14,4 и 28,8 кбит/с. Затем мы выполнили круговое тестирование со "слепым" жюри, в ходе которого каждая технология напрямую сравнивалась со всеми остальными в каждой категории сжатия. Мы обнаружили, что все технологии имеют свои сильные и слабые стороны (результаты приведены в таблицах).
Все компании предлагают бесплатные кодеры по крайней мере для одной платформы. Все системы могут выполнять сжатие быстрее, чем в реальном масштабе времени, но не все располагают дополнительными возможностями, необходимыми для "живого" кодирования. Поэтому если вас интересует прямое вещание, то ваш выбор более ограничен. Фирма Xing Technology Corp. предложила первую систему сжатия аудиоинформации реального времени, но в настоящее время компании Progressive Networks и The DSP Group имеют или готовят аналогичные предложения.
В то время как кодеры функционируют автономно, проигрывателям, для того чтобы органично объединить потоковое воспроизведение звука с "тканью" Web, необходимо работать с различными браузерами и Web-серверами. Чаще всего проигрыватели встраиваются в браузер в качестве вспомогательных (helper) прикладных программ. Как и прочие вспомогательные программы, проигрыватели регистрируются браузером и загружаются, когда тот обнаруживает входящий аудиофайл в соответствующем формате. Будучи загруженным, проигрыватель функционирует как автономная программа. Каждый проигрыватель представляет пользователю набор функциональных средств, в число которых могут входить регулятор громкости, быстрая перемотка вперед, останов и возобновление работы.
К счастью, проблем совместимости с браузерами не возникало. Мы испытывали каждый проигрыватель с пятью программами просмотра Web на базе Windows: браузером на основе программы Mosaic фирмы CompuServe, Microsoft Internet Explorer 2.0, NetManage WebSurfer 4.6, Netscape Navigator 2.0 и Qmosaic 2.0 фирмы Quarterdeck. Все проигрыватели с честью выдержали испытание.
Выпустив программу Navigator 2.0, фирма Netscape подняла планку требований к интеграции проигрывателей. Новая спецификация внешних модулей фирмы Netscape позволяет авторам Web точно задать, каким образом воспроизведение звука и соответствующий проигрыватель будут задействованы на странице Web. Например, автор может начать воспроизведение в момент открытия страницы или, вместо того чтобы запускать проигрыватель в качестве отдельной программы, внедрить его на страницу. Большинство других поставщиков браузеров уже выпускают продукты, отвечающие требованиям спецификации внешних модулей, или выпустят их в ближайшее время.
Все поставщики в данном обзоре бесплатно распространяют свои проигрыватели среди пользователей и разработчиков, но эти изделия различаются своей совместимостью с платформами. Выбирая технологию, убедитесь, что имеются проигрыватели для всех нужных вам целевых платформ. Немногие компании отдают должное платформе UNIX, положившей начало Internet, и еще меньшее их число непосредственно работает с платформой PowerMac.
Выбор между серверной и бессерверной технологиями - первое и наиболее важное решение, встающее перед каждым, кто хочет наделить информационный узел Web потоковыми средствами воспроизведения звука. От этого зависит как число одновременно обслуживаемых системой клиентов, так и набор функциональных возможностей, предоставляемых в распоряжение пользователей. Серверное программное обеспечение обычно представляет собой наиболее дорогостоящую часть системы.
Тестирование в реальных условиях Internet - громоздкая и не поддающаяся строгому определению задача. Доступная полоса пропускания, затраты, связанные с установлением соединения и прокладкой маршрута к удаленным серверам, изменяются в широких пределах и непредсказуемы. Тем не менее наши тесты показывают, что большинство Web-серверов с разумным уровнем вычислительной мощности могут работать одновременно по меньшей мере с пятью аудиопотоками без специализированного серверного программного обеспечения. Этого должно быть достаточно дл удовлетворения нужд многих небольших информационных узлов.
Напротив, разработчики, которым нужно обеспечить одновременное обслуживание десятков потоков, могут с большой степенью вероятности предположить, что им понадобится программное обеспечение аудиосервера, и начать свое обследование с продуктов фирм Progressive Networks и Xing Technology. Серверная платформа также играет ключевую роль. Хотя обе компании предлагают средства для работы с разнообразными платформами UNIX, фирма Progressive также работает для среды Macintosh System 7.5 и Microsoft Windows NT. Компания Xing обещает обеспечить возможность работы в среде Windows NT в I квартале 1996 г.
Набор функциональных средств, предоставляемый в распоряжение конечного пользователя, - еще один аргумент в пользу систем на базе серверов, особенно при работе с большими аудиофайлами. Серверное программное обеспечение необходимо, чтобы дать проигрывателю возможность обеспечить просмотр или быструю прокрутку файла вперед - функции, которые окажутся чрезвычайно удобными для пользователей, если длительность звучани ваших файлов превышает 1 мин. Серверная программа VocalTec предоставляет эти функциональные возможности для ограниченного числа обслуживаемых ею платформ; так же обстоит дело с продуктами фирм Progressive Network и Xing.
Потенциально слабое место серверов Progressive Network и Xing - используемый обеими программами дл передачи аудиопотоков по Internet протокол UDP (User Datagram Protocol - протокол пользовательских дейтаграмм). Продукты VocalTec, Voxware и The DSP Group используют протокол TCP (Transmission Control Protocol - протокол управления передачей).
UDP - ориентированный на максимальное использование полосы пропускания потоковый протокол без коррекции ошибок. Хотя это наиболее эффективный механизм дл передачи нескольких информационных потоков, потери пакетов возможны и действительно происходят. Напротив, TCP - протокол с коррекцией ошибок, гарантирующий упорядоченную доставку пакетов. Однако коррекция ошибок требует дополнительных затрат ресурсов сервера и ограничивает полосу пропускания, равно как и повторна доставка утерянных и искаженных пакетов.
Потери аудиоинформации, вызванные потерей пакетов, оказались минимальными. Но UDP создает другую, потенциально более серьезную проблему, относящуюся к системам защиты корпоративных сетей. В то время как внутренние системы защиты автоматически пропускают TCP-транспортируемую информацию, некоторые из них подавляют информацию, транспортируемую с помощью протокола UDP. Это не затрагивает сферу безопасности сетей, но может отразиться на вашей возможности получать пакеты RealAudio или StreamWorks с сервера, расположенного за пределами системы защиты. Обе фирмы Progressive Network и Xing признают существование проблемы. Компания Progressive Network работает с поставщиками системы защиты, с тем чтобы заручиться их поддержкой программы RealAudio, и к моменту публикации данной статьи, возможно, выпустит сервер с транспортными средствами TCP. Фирма Xing решает эту проблему в каждом конкретном случае отдельно. Использование UDP ставит также на повестку дня вопросы насыщения полосы пропускания каналов связи Internet.
Добавление звука к серверу Web требует некоторого труда, но потраченные усилия окупятся сторицей. Приводимые ниже сообщения об отдельных продуктах помогут решить, какие из них наилучшим образом отвечают вашим нуждам.
Редакция советует:
- RealAudio
- TrueSpeech Internet
Мультимедиа в Web может означать все что угодно - от считанных одновременных потоков до вещания в реальном масштабе времени для тысяч слушателей. Оба продукта, удостоенные нашего отличия "Редакци советует", показывают, что превосходные технологии существуют на обоих концах спектра.
Программа RealAudio фирмы Progressive Networks позволяет реализовать лучшую из всех, виденных нами до сего дня, систему распространения звуковой информации на базе сервера для широковещательных применений, нацеленную на обслуживание сотен пользователей и позволяющую им одновременно обращаться на сервер за одним и тем же файлом. Технология безукоризненно отшлифована, сервер (реализованный для большинства основных платформ) обладает полным набором функциональных средств, а проигрыватель привлекателен и в высшей степени функционален. Кодек RealAudio прекрасно проявил себ при передаче музыки по каналам связи, обслуживаемым широкополосными модемами. Качество передачи речи и узкополосной музыки несколько разочаровывает, и в этом отношении еще есть место для совершенствовани программы.
Продукт TrueSpeech Internet фирмы DSP Group - отличное решение для малых серверов, и к тому же совершенно бесплатное. Данный кодер представляет собой лицензионный компонент программы Sound Recorder (в составе Windows 95), и его ориентированный на обработку речи кодек приносит великолепные результаты в узкополосных каналах связи. Простой проигрыватель TrueSpeech, реализованный на многочисленных платформах Windows и Mac, можно бесплатно загрузить из сети. Если вы только начинаете исследовать потоковые аудиотехнологии, то TrueSpeech - отличная стартова площадка.
Программа StreamWorks фирмы Xing Technology заслуживает почетного упоминания за ее мощную серверную аудиосистему с проверенными возможностями распространения информации и вещания в реальном масштабе времени. Продукт отличается высоким технологическим уровнем, но его доступность и удобство эксплуатации пока оставляют желать лучшего.
После появления Internet Phone - продукта, обеспечивающего дуплексную речевую связь через Internet, - компания VocalTec приобрела репутацию одного из пионеров звука в Internet. Развивая эту технологию, фирма VocalTec выпустила бесплатную программу Internet Wave (IWave), осуществляющую высококачественное узкополосное сжатие музыки и привлекательный проигрыватель. Качество сжатых с помощью IWave речевых сообщений слегка разочаровывает - что удивительно, если учесть родословную продукта, - а набор функций сервера минимален. Однако для серверов, передающих программы "узкополосной" музыки, IWave может оказаться наиболее предпочтительным вариантом.
Программа IWave состоит из трех компонентов: кодера, проигрывателя и простой серверной утилиты, позволяющей быстро пролистать звуковые файлы (для реализации функций обработки потоков серверная утилита не требуется). Каждый компонент можно бесплатно загрузить из Web-сервера фирмы VocalTec. Кодер и сервер объединены в единый пакет, но проигрыватель можно получить только в составе демонстрационной версии программы Internet Phone. Как проигрыватель, так и кодер - прикладные программы Windows 3.x, которые можно использовать также в среде Windows 95 и Windows NT.
Кодер IWave хорошо организован и располагает богатыми функциональными возможностями. В нем предусмотрены четыре различных способа сжатия сигнала (по одному для скоростей передачи 9600 и 14 400 бит/с, и два для 28 800 бит/с). IWave также имеет предварительные функциональные установки для музыки и речи, позволяющие изменять коэффициент сжати содержимого аудиофайлов. Вы можете ввести информацию унифицированного указателя ресурсов URL (Unified Resource Locator), используемую для размещения файла на Web-сервере, название, описание звукового клипа и другие данные, подлежащие отображению в процессе воспроизведения файла.
Снабдив продукт исчерпывающими файлами подсказки и документацией, фирма VocalTec дает пользователю хорошее представление об основах звукозаписи, операциях редактирования и сжатия. Кодер даже предлагает вам помощь в процессе работы: он проверяет входные параметры аудиофайла перед тем, как приступить к сжатию, и выдает предупреждение, если они не соответствуют рекомендованным установкам.
Во время наших испытаний кодер IWave отличался как стабильностью, так и быстродействием. Наш тестовый файл с длительностью звучания 297 с был сжат быстрее, чем за 35 с.
Качество сжатия средствами IWave было неоднородным. Как узко-, так и широкополосные речевые файлы звучали приглушенно и с искажениями, как будто записывались в туннеле. Сжатие при 14,4 кбит/с даже вносило заметную шепелявость. В результате IWave оказалась единственной технологией, не одержавшей ни одной победы на наших речевых тестах сжатия. Однако при сжатии музыки ситуация была обратной. Программа IWave заняла первое место на узкополосных тестах и была второй на 28,8-кбит/с тестах. 14,4-кбит/с музыкальный поток был чистым и сохранил индивидуальное звучание каждого инструмента в значительно большей степени, чем другие рассмотренные здесь продукты.
В процессе сжатия кодер IWave автоматически создает два файла: один - с расширением VMF, в котором хранитс сжатая звуковая информация, и другой - простой текстовый указательный файл с расширением VMD, содержащий описание файла и данные о его местонахождении. Оба расширения должны быть зарегистрированы в качестве MIME (Multipurpose Internet Mail Extensions - расширения многоцелевой почты сети Internet) типов на вашем Web-сервере. Расширение VMD снабжается на странице HTML признаком-тегом и служит для инициализации выборки файла.
Фирма VocalTec также поставляет серверную утилиту, позволяющую быстро прокрутить звуковой файл. Эта утилита доступна только для операционной среды Solaris 2.4 и SunOS4.x, поэтому мы не проводили ее тестирование.
Чтобы получить проигрыватель IWave, необходимо загрузить из сети демонстрационную версию пакета Internet Phone фирмы VocalTec - 1,3-Мбайт самораспаковывающийся zip-файл, в котором хранятс программные компоненты, инсталлируемые по команде Start/Run (Старт/Выполнить). Подобно кодеру IWave, этот пакет представляет собой программу для среды Windows 3.x, совместимую также с Windows 95 и Windows NT. Когда мы готовили материал к печати, фирма VocalTec объявила о выходе версии IWave и Internet Phone для компьютеров Macintosh, ликвидировав серьезный пробел в своем семействе продуктов.
Для того чтобы графически отобразить текущее состояние сеанса воспроизведения, проигрыватель выводит на экран анимированную фигурку с магнитофоном. Когда файл начинает загружаться, фигурка вставляет вилку в электрическую розетку; затем, во время воспроизведени файла, фигурка радостно пританцовывает. Если недостаточный объем буфера прерывает воспроизведение, то фигурка вскакивает на аппарат и подпрыгивает вверх-вниз. Это вряд ли произведет благоприятное впечатление на вашего застегнутого на все пуговицы шефа, но очень понравится многочисленной молодежи, осваивающей просторы Internet.
Проигрыватель IWave располагает подходящим набором функциональных средств: регулятором громкости, линейкой состояния и цифровым индикатором времени воспроизведения, а также кнопками останова и возобновления работы. Вам также предоставляетс возможность вывести на экран имя автора, описание и источник звукового файла (вся эта информация должна быть введена на стадии сжатия). Другие новые средства управления позволяют управлять размером кэша, используемого в ходе загрузки файла, временем предварительной буферизации и объемом загруженной из сети аудиоинформации, сохраняемой на диске.
Хотя данный проигрыватель был совместим со всеми программами просмотра Web, использовавшимися в процессе тестирования, он не регистрировался автоматически в качестве вспомогательного модуля Netscape во врем инсталляции, а для регистрации VMD-расширения IWave нам потребовалось повторить инсталляцию три или четыре раза. В среде Windows 95 и Windows 3.x проигрыватель часто не удавалось загрузить; приэтом выдавалось сообщение об ошибке: "Для функционирования Internet Wave требуется инсталлировать на компьютере программу Internet Phone." Конечно, продукт Internet Phone был уже установлен, и нам зачастую приходилось запускать Internet Phone для того, чтобы получить доступ к проигрывателю.
Несмотря на перечисленные недочеты, качество воспроизведения музыки делает программу IWave пригодной для музыкального оформления любых узлов Web, не требующих наличия у сервера передовых функциональных возможностей.
Internet Wave
Цена, рекомендуемая изготовителем: бесплатно.
VocalTec Inc., Northvale, NJ; 201-768-9400; fax, 201-768-8893;
http://www.vocaltec.com.
В то время как в других продуктах, рассматриваемых в данном обзоре, разработчики сконцентрировали свои усилия на повышении качества сжатого сигнала, а передачу звуковых файлов перепоручили Web-серверу, фирма Progressive Networks предлагает законченную систему доставки аудиоинформации для Internet, располагающую аудиокодеком, который продемонстрировал выдающиеся результаты в широкополосных музыкальных программах. Если вы создаете аудиосервер, рассчитанный на низкий трафик, то вам не понадобятся все функциональные возможности, предлагаемые системой RealAudio. Если же вы намерены транслировать для сотен пользователей, то данный продукт, несомненно, должен быть внесен в список, из которого вы сделаете свой окончательный выбор.
Цена программы RealAudio Server зависит от числа обслуживаемых им одновременных потоков. Она изменяетс в диапазоне от 2490 долл. за десять одновременных потоков до 13 490 за 100 потоков, включая техническое обслуживание и предоставление обновленных версий в течение года (базовые цены лежат в пределах от 1495 до 9995 долл.). Проигрыватель RealAudio Player можно получить бесплатно с Web-сервера фирмы Progressive Networks или с сервера одного из бесчисленных клиентов RealAudio. Мы тестировали бета-версию программы RealAudio, Version 2.0.
Кодер RealAudio поставляется в виде самораспаковывающегося 323-Кбайт файла, из которого извлекаются один EXE и различные вспомогательные файлы. Программа работает на полном экране, разделенном на две части. На левой стороне отображаются входной файл, который может иметь расширение AU, RA или WAV, либо звуковая информация в реальном масштабе времени дл широковещательных приложений. На правой стороне экрана показаны выходные данные, которые могут быть представлены сжатым файлом или "живым" потоком, направленным в RealAudio Server.
Существуют два типа выходных сжатых файлов RealAudio: 14,4-кбит/с и 28,8-кбит/с. Программа дает вам возможность ввести название произведения, им автора и информацию об авторских правах, которая затем встраивается в заголовок файла и может быть прочитана проигрывателем RealAudio Player. Чтобы помочь вам контролировать аудиовещание, кодер наделен функцией, позволяющей прослушивать исходный файл или сжатый RealAudio-файл в процессе сжатия.
Фирма Progressive Networks основательно подошла к документированию процесса записи и сжатия, предлага файлы подсказки, README-файлы, технические руководства и другую информацию со своего сервера Web. Кодер стабилен и функционален; сжатие всех тестовых файлов прошло без осложнений.
Результаты сжатия, однако, были неоднородны. Программа RealAudio плохо показала себя на наших речевых тестах, 14,4-кбит/с поток звучал неотчетливо и сопровождался легким эхо. 28,8-кбит/с речевой поток был намного чище, но все равно не мог сравниться с широкополосным звучанием продуктов StreamWorks, ToolVox и TrueSpeech.
Вместе с тем, программа RealAudio с явным преимуществом победила на широкополосных музыкальных тестах, продемонстрировав ясное, отчетливое звучание (хотя и не совсем на уровне ЧМ-вещания, как было обещано в документации). Узкополосная музыка звучала размыто и неясно, позволив RealAudio лишь разделить второе место в этой категории.
Программа RealAudio Server, осуществляющая доставку сжатой аудиоинформации, реализована на платформах Macintosh, UNIX, Windows NT и совместима с рядом других серверных технологий. Мы инсталлировали версию Windows NT на сервере Netscape Communications Server.
Для инсталляции нужно выполнить три простых шага. Во-первых, мы сконфигурировали сервер как порт протокола PNA, задали максимальными число аудиосоединений и время ожидания готовности канала связи. Затем был зарегистрирован формат RealAudio в качестве типа MIME на сервере Netscape. Наконец, мы инсталлировали сервер как службу в среде Windows NT.
В качестве транспортного механизма для пересылки аудиопакетов в программе RealAudio Server применяетс протокол UDP без коррекции ошибок. В ходе тестировани на реальных серверах с интенсивной нагрузкой были отмечены отдельные случаи потери пакетов.
В число стандартных функциональных средств сервера входят средства удаленного контроля и графического отображения эксплуатационной информации. В версии 2.0 программы появились дополнительные средства: нова технология ветвления, позволяющая удаленным серверам ретранслировать RealAudio-файлы на несколько сетевых узлов, перестройка полосы пропускания, дающа возможность серверу запрашивать проигрыватель RealAudio Player и автоматически выбирать подходящую полосу пропускания для передачи данных, интерфейс прикладного программирования (API), позволяющий другим технологиям сжатия работать в рамках архитектуры доставки информации RealAudio.
Встраивание средств воспроизведения RealAudio в Web-сервер требует наличия текстового файла с расширением RAM, содержащего имя и местонахождение собственно файла RealAudio. Когда пользователь щелкает мышью на тэге-признаке, сервер RealAudio устанавливает связь с проигрывателем RealAudio и сообщает ему координаты файла. Затем проигрыватель производит выборку файла и приступает к его воспроизведению.
Программа RealAudio может оказаться несовместимой с некоторыми системами защиты, но фирма Progressive Networks работает совместно с поставщиками таких систем над разрешением этой проблемы. В I квартале 1996 г. она планировала выпустить новый сервер RealAudio, в котором будут реализованы транспортные возможности, заложенные в протоколах TCP.
Существуют версии RealAudio Player для Macintosh, UNIX, Windows 95, Windows 3.x и Windows NT. Мы испытали версию для Windows 95, 656-Кбайт самоинсталлирующийс исполнимый файл, который можно применять в качестве внешнего модуля для Netscape 2.0 или вспомогательной прикладной программы для других программ-браузеров.
Проигрыватель предусматривает строку состояния, которую можно перетащить в произвольное место экрана, таймер, регулятор громкости и возможность приостанавливать и возобновлять воспроизведение звуковых клипов. Оформление программы имеет традиционный и солидный вид. Вы можете сократить проигрыватель до размера кнопок старт и останов, или развернуть его до полного окна, в котором отображаютс статистика соединений и информация о звуковом файле.
Хотя программа RealAudio не имеет равных при воспроизведении музыки на скорости 28,8 кбит/с, качество сжатия речи оставляет желать лучшего. Но даже в этом случае его отшлифованная и пользующаяся широким признанием серверная технология в настоящее врем представляется наилучшим выбором для передачи большого числа одновременных потоков.
RealAudio
Цена, рекомендуемая изготовителем: сервер: 10 потоков - 2490 долл.; 100 потоков - 13 490 долл.; кодер и проигрыватель - бесплатно.
Progressive Networks Inc., Seattle, WA; 206-447-0567; fax, 206-223-8221;
http://www.realaudio.com.
Несмотря на то что аудиотехнология StreamWorks фирмы Xing Technology дорого стоит и не очень хорошо документирована, вы убедитесь в ее чрезвычайной мощи и эффективности сразу же, как только запустите ее в работу. Эта высококлассная мультимедиа-система, очевидно, избыточна для небольшого сервера, обслуживающего два или три одновременных звуковых потока. Но уникальное сочетание возможности расширени и масштабируемости делает ее пригодной для тех, кто одновременно вещает для сотен клиентов, и дл Web-серверов, обслуживающих клиентов, располагающих каналами связи с различной шириной полосы пропускания.
StreamWorks - серверная технология, цена которой зависит от ширины полосы пропускания канала связи. Разброс цен составляет от 3500 долл. за 1,5-Мбит/с соединение до 50 тыс. долл. за 1600-Мбит/с соединение. Фирма Xing предлагает два варианта кодера: аппаратный кодер по цене 2500 долл., работающий с аудиоинформацией в реальном масштабе времени, и бесплатный программный кодер для систем, функционирующих в иных временных масштабах. Аппаратный видеокодер рассмотрен в нашем обзоре видеопродуктов для Web в этом же номере.
Программный кодер StreamWorks представляет собой программу, запускаемую из командной строки DOS и преобразующую WAV-файлы в собственный формат LBR (Low Bit Rate - низкая скорость передачи двоичных данных) фирмы Xing. Единственный параметр сжатия - скорость передачи данных сжатого файла в битах, причем значение этого параметра лежит в пределах от 8 до 16 кбит/с. Программа, хотя и не слишком элегантна, работает быстро и стабильно.
Единственный существенный недостаток данной системы заключается в том, что клиент StreamWorks не может воспроизводить локальные файлы с диска; он способен работать лишь с потоковыми файлами, поступающими с Web-сервера. Поскольку фирма Xing не предлагает сервера для Windows, для тестирования файлов необходимо загрузить их на Web-сервер, а это значительное неудобство. Фирма Xing планирует начать поставки модул сжатия/проигрывателя на базе Windows в I квартале 1996 г.
Как и все другие технологии в данном обзоре, программный кодер показал на наших тестах разнородные результаты. На узкополосных речевых и музыкальных тестах результаты оказались плохими, но на 28,8-кбит/с тестах программный кодер возглавил таблицу результатов. Его четкий, ясный звуковой поток в широкополосных каналах был практически неотличим от оригинального тестового файла.
Аппаратное устройство сжатия StreamWorks (протестированное для нашего обзора видеопродуктов) создает аудиофайлы MPEG-1 и MPEG-2 с более высокой скоростью передачи двоичных данных и более высоким качеством, а также LBR-файлы. В отличие от прочих потоковых аудиотехнологий, в которых аппаратно задана максимальная скорость передачи данных 28,8 кбит/с, данный кодер может перестраиваться для работы с более широкополосными каналами связи, такими, как одно- и двухканальная ISDN (64 и 128 кбит/с). Это ключева особенность архитектуры StreamWorks. Поскольку мы имеем дело с технологиями сжатия, допускающими потери, увеличение скорости передачи данных в случаях, когда полоса пропускания канала связи позволяет сделать это, улучшает также и качество воспроизведения звука.
И все же преимущество, обеспечиваемое этой аппаратной системой при сжатии данных в реальном масштабе времени, постепенно сходит на нет. Фирма Progressive Networks предлагает бесплатные программные средства сжатия, работающие в реальном масштабе времени, в версии 2.0 кодера RealAudio, а фирма The DSP Group намеревается за номинальную цену предложить программные средства сжатия данных в реальном масштабе времени для продукта TrueSpeech в первом полугодии 1996 г.
Мы тестировали сервер StreamWorks на компьютере Silicon Graphics WebForce Challenge в среде SGI IRIX. Вместо того чтобы снабдить свой продукт документацией, фирма Xing рекомендует пользователям обратиться в ее службу технических консультаций за регистрационной информацией и простыми инструкциями по инсталляции. После короткого телефонного разговора мы сконфигурировали сервер, зарегистрировали тип MIME и запустили сервер в работу всего за несколько минут.
Подобно программе RealAudio, концепция построени сервера фирмы Xing в основном базируется на концепции расширяемости. Хотя планы фирмы Progressive Networks еще не реализованы, технология Reflecting Server компании Xing работает уже несколько месяцев. В сущности, серверы Reflecting Server функционируют как удаленные серверы StreamWorks, принимающие аудиопоток (или аудио/видео поток) и ретранслирующие его нескольким клиентам. Это дает автору распространяемых материалов возможность обслуживать гораздо большее число клиентов, нежели позволяет его собственное соединение Internet.
Программа StreamWorks работает по протоколу UDP, а не TCP, предпочтение в ней отдано эффективности вещания, быть может с риском снижения качества передачи. Чтобы избежать проблем несовместимости с системами защиты, фирма Xing предлагает системным администраторам "программную заплату" (Patch). Она направляет пакеты StreamWorks в обход систем защиты, не нарушая при этом целостность последних.
Клиент StreamWorks Client, реализуемый на платформах MacOS, UNIX и Windows 3.x (Windows 95 и Windows NT-совместимый), обеспечивает два различных режима доступа к файлам: режим непосредственного соединения и режим наблюдения. Первый напрямую запрашивает базу данных StreamWorks, расположенную на сервере StreamWorks, и воспроизводит конкретный файл. Во втором случае клиент, функционирующий в качестве вспомогательной прикладной программы вашего браузера, считывает небольшой текстовый файл с расширением XDM, встроенный в страницу Web. Этот XDM-файл затем вызывает клиента с помощью URL. Клиент вызывает сервер с тем, чтобы начать потоковый процесс.
В режиме прямого соединения вы можете переходить от сервера к серверу, воспользовавшись своим собственным набором заранее сконфигурированных кнопок - очень похоже на переключение телевизионных каналов с пульта дистанционного управления. В вашем распоряжении имеютс также органы управления громкостью и буфером. В режиме наблюдения вы можете настроить внешний вид и функциональные средства клиента. Вы получаете возможность регулировать громкость и проводить поиск в произвольно выбранных местах, но не можете останавливать и возобновлять воспроизведение. Во врем подготовки статьи к печати фирма Xing предлагала также бета-версию клиента, оформленного в виде внешнего модуля программы Netscape 2.0.
Программа StreamWorks - технически зрелый продукт промышленного уровня, хотя он и страдает от неполноты документации. По всей видимости, фирма Xing в скором времени устранит этот недостаток. Авторы Web, заинтересованные в средствах для интенсивного вещания, обнаружат, что StreamWorks предлагает им более чем достаточную компенсацию за усилия, которые им придетс приложить для запуска системы.
StreamWorks
Цена, рекомендуемая изготовителем: сервер: соединение 1,5 Мбит/с - 3500 долл.; соединение 1600 Мбит/с - 50 тыс. долл.; кодер и проигрыватель - бесплатно.
Xing Technology Corp., Arroyo Grande, CA;805-473-0145; fax, 805-473-0147;
http://www.xingtech.com.
Если вы работаете исключительно с речевой информацией, то в своей программе ToolVox фирма Voxware предложит вам замечательную узкополосную аудиотехнологию. Этот бесплатный пакет разделил первое место на наших 14,4-кбит/с речевых тестах, даже несмотря на то, что использовал лишь 30% полосы пропускания ближайшего конкурента. К сожалению, ориентированный на сжатие речевых сигналов алгоритм MetaVoice программы ToolVox совершенно не пригоден дл работы с музыкой и страдает от отсутствия как полнофункционального проигрывателя, так и современных средств сервера. Но авторам, желающим добавить узкополосную речевую информацию к своим Web-страницам, будет нелегко найти лучшее решение.
Вся серия продуктов фирмы Voxware строится вокруг алгоритма сжатия MetaVoice. В отличие от большинства традиционных технологий сжатия аудиоинформации, которые производят сжатие, усредняя элементы данных и исключа избыточность, MetaVoice тщательно анализирует преобразованную в цифровой код аудиоинформацию и создает математическую модель индивидуальных речевых характеристик говорящего.
Качество моделирования и эффективность использовани полосы пропускания чрезвычайно высоки. ToolVox разделила первое место с программой TrueSpeech фирмы The DSP Group на наших 14,4-кбит/с речевых тестах, но размер файла TrueSpeech составил 317 Кбайт, тогда как размер файла ToolVox был всего 89 Кбайт. Моделирование также дает возможность манипулировать скоростью воспроизведения, увеличивая или уменьшая ее без искажений и изменений тональности.
MetaVoice до такой степени настроен на работу с речевой информацией, что файл подсказки ToolVox предупреждает "Не пытайтесь сжимать данные в волновой форме, содержащие записи музыкальных инструментов, звуковых эффектов и речь или пение более чем в один голос". Ради полноты эксперимента мы начали испытани ToolVox с нашим музыкальным тестовым файлом, но результаты оказались столь плохими, что ToolVox пришлось исключить из нашего музыкального конкурса.
Программа ToolVox состоит из двух компонентов: кодера WebEncoder и проигрывателя WebPlayer. Поскольку фирма Voxware не предлагает серверного компонента, файлы ToolVox должны быть встроены в сервер Web с помощью стандартных ссылок HTML.
Во время нашего тестирования имелась верси WebEncoder только для Windows 95, но фирма Voxware намеревается предложить варианты программы как дл Macintosh, так и для Windows 3.x. Загружаемый из сети исполнимый файл размером 1192 Кбайт представляет собой самоинсталлирующуюся программу; распаковки не требуется. После инсталляции WebEncoder может работать с AIFF- и WAV-файлами с любыми параметрами, но перед сжатием уменьшает их частоту дискретизации до 8 кГц. Все входные файлы сжимаются до 2400 бит/с, а какие-либо средства регулировки полосы пропускания или предварительные установки отсутствуют.
Даже при такой узкой полосе пропускания качество воспроизведения звука ToolVox оказалось достаточным, чтобы на наших 14,4-кбит/с тестах эта программа разделила первое место с продуктом TrueSpeech. При сравнении с исходным несжатым аудиофайлом сжатый файл ToolVox звучал четко и без заметного слияния звуков или разрывов. Единственное очевидное отличие от подлинника заключалось в том, что звук приобретал легкий металлический оттенок и сопровождался слабым эхом, что напоминало дальний телефонный разговор.
Неспособность программы WebEncoder перестраиватьс для работы с более широкой полосой пропускания налагает ограничения на ее функциональные возможности, о чем свидетельствует и снижение ее относительных показателей в нашем 28,8-кбит/с речевом состязании. Но только программа Streamworks, используя почти в семь раз большую полосу пропускания, смогла превзойти качество воспроизведения звука программой ToolVox.
Процесс сжатия данных был относительно прост, хот время от времени WebEncoder терял наши WAV-файлы после загрузки; в ряде случаев файлы приходилось вводить по два-три раза, прежде чем их наконец-то удавалось сжать. Время сжатия было чрезвычайно коротким - 35 с дл нашего 297-с тестового файла, но ToolVox не дает возможности выполнить сжатие в реальном масштабе времени для одновременной передачи файла нескольким узлам Web (simulcasting).
WebEncoder выполняет также роль модулей звукозаписи и воспроизведения для WAV- и VOX-файлов. Последн функция позволяет тестировать сжатые файлы, не загружа WebPlayer, - удобная возможность. Исчерпывающая и полезная оперативная подсказка освещает такие темы, как коды HTML для встраивания VOX-файлов в страницы Web и рабочие параметры сменных модулей Netscape 2.0.
WebPlayer - самоинсталлирующаяся программа размером примерно 600 Кбайт. Единственной доступной для нашего тестирования платформой была Windows 95, хотя фирма Voxware планирует выпустить проигрыватели для Windows 3.x и Macintosh System 7 (редакции для процессоров 68K и PowerMAC).
WebPlayer можно использовать в качестве внешнего модуля для Netscape 2.0 и как вспомогательную прикладную программу для Netscape 1.x и других программ просмотра Web. Поскольку WebPlayer - не серверна система, она не позволяет просматривать аудиофайл или останавливать, а затем возобновлять воспроизведение в середине файла. Этот недостаток несколько смягчаетс способностью программы быстро "прокручивать" аудиофайл к нужным точкам.
Неоновый интерфейс WebPlayer отличается излишне кричащими красками. На имитируемом ЖК-дисплее отображаются имена файлов и истекшее время, органы управления остановом и началом воспроизведения и линейка с движком для быстрой перемотки вперед. Хотя на дисплее имеется индикатор громкости, регулятор громкости или линейка, индицирующая ход процесса, отсутствует. Странный внешний вид интерфейса программы WebPlayer и ее ограниченные функциональные возможности способны вызвать досаду при воспроизведении долгоиграющих звуковых клипов или при необходимости обширного взаимодействия с аудиосистемой.
WebPlayer гладко прошел наши тесты на совместимость, верно загрузившись во всех испытательных средах. Он также безукоризненно выполнил все соединения в ходе наших тестов в реальной обстановке.
Оба компонента ToolVox поставляются бесплатно, но фирма Voxware к середине 1996 г. намеревается выпустить "золотые" версии кодера, обеспечивающие несколько лучшее качество звуковоспроизведения при той же полосе пропускания. Хотя цены еще не определены, стоимость "золотых" версий, по-видимому, будет ниже 100 долл.
В целом программа ToolVox представляет собой продукт с узкой специализацией, обеспечивая узкополосное сжатие и воспроизведение речевой информации без функциональных излишеств. Она, однако, может пригодиться в случае, если вам не требуется сжатие музыки.
ToolVox for the Web
Цена, рекомендуемая изготовителем: бесплатно.
Voxware Inc., Skillman, NJ; 609-497-1212; fax, 609-497-2490;
http://www.voxware.com.
В отличие от прочих специализированных речевых продуктов программа TrueSpeech Internet фирмы The DSP Group обеспечивает отличное качество дл воспроизведения как узкополосной музыки, так и речи. В ней не предусмотрены развитые широковещательные средства и такие простые функции проигрывателя, как останов и возобновление воспроизведения, но проигрыватель поставляется бесплатно, а технологи сжатия/распаковки встроена в Microsoft Windows 95. Если вы хотите предложить несколько типов узкополосных звуковых сообщений, то программа TrueSpeech станет хорошим выбором.
Технология сжатия TrueSpeech используется в разнообразных продуктах, в том числе в цифровых автоответчиках, телефонах и двухфункциональных модемах, осуществляющих одновременную передачу данных и устной речи. Помимо программных и аппаратных средств фирма The DSP Group предлагает обширный набор алгоритмов сжатия; в каждом из них реализуется свой компромисс между сложностью процедур сжатия и воспроизведения с одной стороны и коэффициентами сжатия и качеством звучания - с другой.
В 1994 г. фирма The DSP Group выдала корпорации Microsoft лицензию на использование алгоритма TrueSpeech 8.5 в системе Windows 95. Эта верси алгоритма обеспечивает коэффициент сжатия 15:1, что сокращает 8-МГц 16-разрядный звуковой поток до примерно 8,5 кбит/с и делает возможным воспроизведение в реальном масштабе времени на компьютерах 486/33 и более быстродействующих. В августе 1995 г. фирма The DSP Group объявила о выпуске в свет программы TrueSpeech Internet, которая также построена на базе алгоритма TrueSpeech 8.5.
Подобно программе ToolVox for the Web фирмы Voxware, продукт TrueSpeech Internet оптимизирован для устной речи и использует сложные методы моделирования дл достижения относительно высокой степени сжатия и высокого качества воспроизведения. Хотя показатели ToolVox при работе на узкополосных каналах связи недосягаемы для программы TrueSpeech, она соперничает с ToolVox по качеству речи и одновременно обеспечивает приемлемое сжатие музыки. Это делает программу TrueSpeech намного более подходящей для аудиосерверов общего назначения и информационных узлов, сочетающих речь с музыкальным фоном.
Для воспроизведения потокового звука необходим проигрыватель TrueSpeech Internet Player, который можно получить на Web-сервере фирмы The DSP Group. Хот программа сжатия работает только в среде Windows, проигрыватель представлен версиями как для Windows, так и для Macintosh. The DSP Group рассматривает возможность разработки серверного программного обеспечения, которое позволит выполнять сжатие в реальном масштабе времени, но ко времени сдачи этой статьи в печать дата выпуска и цена продукта еще не были известны.
Мы тестировали программу TrueSpeech в среде Windows 95, используя компонент Sound Recorder (звукозапись) этой операционной системы для сжатия звуковой информации. Sound Recorder обладает весьма неплохими функциональными возможностями, обеспечивая как запись, так и сжатие. Но он не содержит документации, поясняющей работу программы TrueSpeech. Единственный источник подсказки при кодировании или воспроизведении файлов TrueSpeech - это файл README, поставляемый вместе с проигрывателем TrueSpeech.
Следуя рекомендациям, содержащимся в файле README, было проведено тестирование с 80-кГц 16-разрядными WAV-файлами. Мы сжимали эти файлы с помощью программы Sound Recorder, изменяя их формат на TrueSpeech и сохраняя результат. После завершения данной процедуры файл в формате TrueSpeech автоматически загружается в Sound Recorder, что позволяет вам немедленно оценить результаты сжатия.
TrueSpeech не имеет предварительных установок или органов, позволяющих управлять процессом сжатия; все файлы просто сжимаются до приблизительно 8,5 кбит/с. На нашей испытательной 133-МГц Pentium-системе программа TrueSpeech функционировала быстрее, чем в реальном масштабе времени, сжав 297-с тестовый файл менее чем за 120 с.
На наших 14,4-кбит/с тестах сжатия речевой информации TrueSpeech разделила первое место с продуктом ToolVox. Программа дает чрезвычайно чистый звук, без эха или металлического оттенка и лишь со слабым намеком на смешение соседних звуков. Хот алгоритм TrueSpeech предназначен в основном для сжати речи, он проявил себя на наших узкополосных музыкальных тестах лучше, чем большинство других алгоритмов. На наших 28,8-кбит/с тестах однополосный алгоритм TrueSpeech имел меньший успех - он занял второе место после программы Streamworks на речевых тестах и оказался последним на широкополосных музыкальных тестах.
Так как файлы TrueSpeech используют стандартное расширение WAV, фирма The DSP Group создала расширение TSP, чтобы включать файлы TrueSpeech в состав страниц Web. Вместо того чтобы прямо указывать на WAV-файл в HTML-описании, вы должны указать на TSP-файл, в свою очередь указывающий на WAV-файл TrueSpeech. Псевдоним TSP зарегистрирован на серверах Web как стандартный тип MIME.
Загружаемый из сети 282-Кбайт файл программы TrueSpeech Internet Player содержит исполнимую программу, которая распаковывает сохраненные в ней различные установочные файлы. Программа выглядит аскетичной и в отношении оформления, и функциональных возможностей. В программе реализованны бессерверна технология, поэтому TrueSpeech не дает возможности останавливать, а затем возобновлять воспроизведение или получить произвольный доступ к аудиопотоку. Отсутствует также и регулятор громкости.
К достоинствам программы относится то, что TrueSpeech позволяет вам регулировать начальный размер буфера загрузки с целью уменьшения задержки буферизации. Проигрыватель дает также возможность сохранять закладки, которые могут оказаться полезными при воспроизведении сжатых аудиофайлов вне среды вашего браузера. Испытанная нами версия взаимодействует с программами просмотра Web только в качестве вспомогательной прикладной программы, но во врем подготовки данной статьи к печати фирма The DSP Group работала над проигрывателем, подключаемым к Netscape 2.0 в качестве внешнего сменного модуля.
Многие потоковые технологии сжатия аудиоинформации требуют наличия специализированных проигрывателей, но файлы TrueSpeech совместимы со стандартными программами типа Media Player. Значение этого фактора будет возрастать по мере того, как разработчики начнут распространять свои продукты одновременно на CD-ROM и в Web. Разработчики могут также получить доступ к программе сжатия TrueSpeech из стандартных аудио- и видеопакетов редактирования, что значительно облегчает работу с алгоритмом.
В целом TrueSpeech - прекрасный выбор для авторов Web, желающих иметь простое и высококачественное средство воспроизведения, рассчитанное на аудиторию с 14,4-кбит/с модемами. Тем разработчикам, кому требуетс сервер, обладающий средствами более высокого уровня, или желающим обслуживать клиентов с широкополосной аппаратурой, лучше обратиться к иным технологиям.
TrueSpeech Internet
Цена, рекомендуемая изготовителем: проигрыватель - бесплатно. Кодер поставляется в составе Microsoft Windows 95;
The DSP Group Inc., Santa Clara, CA; 408-986-4300; fax, 408-986-4490;
http://www.dspg.com.
Как проводились испытания потоковых аудиотехнологий
Анализ подготовил Джей Манро
При оценке качества воспроизведения каждого рассмотренного продукта мы полагались на мнение жюри. Чтобы обеспечить беспристрастное судейство, мы держали членов жюри в неведении относительно того, какой именно декодер они прослушивают. Выбрав два звуковых образца, музыкальный фрагмент в стиле рок и речевой отрывок, мы закодировали каждый из них дл воспроизведения со скоростями 14,4 и 28,8 кбит/с. Каждый продукт последовательно и индивидуально сравнивался со всеми остальными (один на один) на обеих скоростях. Испытатели оценивали чистоту, точность воспроизведения и "пригодность дл прослушивания" (отсутствие раздражающих артефактов). Для каждого продукта фиксировался результат каждого сравнения - победа, ничья или поражение (1, 0,5 или 0 баллов). Окончательные результаты каждого продукта просуммированы на показанных выше диаграммах. Мы воспроизводили все образцы на компьютере HP Vectra XU 5/90C со звуковой платой Diamond TeleCommander 3500XL и громкоговорителями Advent Powered Partners AV622. Исключением был продукт StreamWorks фирмы Xing Technology, не предусматривающий воспроизведение локальных файлов. Мы пересылали образцы для продукта Xing на данную рабочую станцию HP с локального сервера.
Скорость сжатия каждого аудиокодера тестировалась путем измерения времени, необходимого для сжати 297-с речевого WAV-файла. Кодирование выполнялось в расчете на воспроизведение со скоростью 28,8-кбит/с на компьютере Gateway 2000 P5-133. Хотя мы обнаружили широкий разброс результатов, все кодеры выполняли сжатие, чем в реальном масштабе времени.
Наши тесты совместимости давали возможность выяснить, совместимы ли модули проигрывателя с пятью наиболее распространенными программами просмотра Web: браузером на основе программы Mosaic фирмы CompuServe, Microsoft Internet Explorer 2.0, NetManage WebSurfer 4.6, Netscape Navigator 2.0, Qmosaic 2.0 фирмы Quarterdeck и StreamWorks. Случаев несовместимости не обнаружили. Мы также неформально проверили возможность установления пяти одновременных соединений с внешним аудиосервером, чтобы убедиться в способности каждой технологии обслуживать по меньшей мере пять потоков.
Роль клиентов воспроизведения играли компьютеры HP Vectra XU 5/90C, подключенные к 10-Мбит/с сети Ethernet через встроенные адаптеры PCI Ethernet. Нашим тест-сервером был компьютер Micron Pentium 133 с 64-Мбайт ОЗУ, выполнявший программу Netscape Communications Server 1.1 в среде Microsoft Windows NT Server 3.51. Исключение было сделано для продукта StreamWorks фирмы Xing, которую мы испытывали с сервером Silicon Graphics Challenge S.
Чем меньше показатель, тем лучше.
Сжатие с помощью кодера Время, необходимое
для сжатия
297-с аудиофайла,
мин:сInternet Wave 0:35 Real Audio 2:02 StreamWorks 0:19 ToolVox 0:35 TrueSpeech Internet 1:56
Максимальный возможный результат 4 балла
Оценки жюри: речь, баллы 14,4-кбит/с линия 28,8-кбит/с линия Internet Wave 0 0 Real Audio 1,5 1,0 StreamWorks 1,5 4,0 ToolVox 3,5 2,5 TrueSpeech Internet 3,5 2,5
Чем больше показатель, тем лучше
Максимальный возможный результат 3 балла
Оценки жюри: музыка, баллы 14,4-кбит/с линия 28,8-кбит/с линия Internet Wave 3,0 2,0 Real Audio 0,5 2,0 StreamWorks 0,5 3,0 ToolVox N/A N/A TrueSpeech Internet 2,0 0
Чем больше показатель, тем лучше
N/A - неприменимо. Продукт ToolVox не предназначен для сжатия музыки.
+ ДА - НЕТ | Internet Wave 1.0 | RealAudio 2.0 | StreamWorks | ToolVox for the Web | TrueSpeech |
---|---|---|---|---|---|
Цена программного обеспечения сервера | N/A | Изменяется в зависимости от числа обслуживаемых потоков | Изменяется в зависимости от полосы пропускания обслуживаемых каналов | N/A | N/A |
HPUX/LINUX/BSDI | N/A | - + + | + + + | N/A | N/A |
Macintosh, OS/2 | N/A | + - | - - | N/A | N/A |
SGI/Sun Solaris/SunOS 4.x | N/A | + + + | + + + | N/A | N/A |
Windows NT | N/A | + | - * | N/A | N/A |
Дистанционный контроль | N/A | + | + | N/A | N/A |
Протокол передачи | TCP | UDP | UDP | TCP | TCP |
Одновременная пересылка аудио/видео файла группе пользователей | - | - * | + | - | - |
Кодер | |||||
Цена | Бесплатно | Бесплатно | Бесплатно | Бесплатно | Бесплатно |
Программа рассчитана на Windows 95 | - | + | - | + | + |
Программа рассчитана на Windows 3.x | + | - | - | - * | + |
Программа рассчитана на DOS | - | - | + | - | - |
Программа рассчитана на OS/2 | - | - | - | - | - |
Кодирование в реальном масштабе времени | - | + | Факультативно (2500 долл.) ** | - | - |
Форматы входных файлов | AU,WAV | AIFF, AU,WAV | WAV, записанный поток или прямое вещание | AIFF, WAV | WAV |
Предварительно устанавливаемая полоса пропускания, кбит/с | 5,5; 8,0; 11,0; 16,0 | 8,0; 15,0 | 8,0 - 16,0 (масштабируется) | 2,4 | 8,5 |
Пакетная обработка | - | + | + | - | - |
Встроенная программа записи | - | + | - | + | - |
Проигрыватель | |||||
Цена | Бесплатно | Бесплатно | Бесплатно | Бесплатно | Бесплатно |
Программа рассчитана на Windows 95/3.x/NT | - + - | + + + | - + - | + -* - | + + + |
Программа рассчитана на OS/2 | - | - | - | - | - |
Программа рассчитана на Unix/Macintosh | - - | + + | + + | - -* | - + |
Использование как автономной программы | + | + | + | + | + |
Использование как вспомогательной прикладной программы | + | + | + | + | + |
Использование как внешнего модуля Netscape -.0 | - | + | + | + | - * |
Минимальная рекомендуемая скорость соединения, кбит/с | 9,6 | 21,6 | 9,6 | 9,6 | 14,4 |
Размер загружаемого из сети файла декодера, Мбайт | 1,3 | 0,7 | 0,5 | 0,6 | 0,6 |
Встроенная линейка состояния | + | + | + | - | + |
Индикатор времени | + | + | + | + | - |
Воспроизведение с любого места | + | + | + | - | - |
Останова и возобновление воспроизведения | + | + | - | - | - |
Регулятор громкости | + | + | + | - | - |
Перемотка назад | + | + | - | - | - |
Перемотка вперед | + | + | - | - | - |
Перестраиваемый размер буфера | + | - | - | + | + |
Локальная оперативная подсказка | + | + | + | - | - |
Проигрыватель работает надежно | + | + | + | + | + |
Видео в Web находится на начальной стадии своего развития, когда необходимо утрясти множество проблем и устранить массу недостатков. Но фундамент уже заложен, а потенциал - огромен.
В 1992 г., на заре развития мультимедиа, разработчики видеокодека продемонстрировали зернистое, искаженное видеоизображение с разрешением 160x120 и частотой вертикальной развертки, едва достигавшей 15 кадр/с, вопроизводимое с односкоростных накопителей CD-ROM. Радостно встреченные некоторыми, но проигнорированные большинством, такие кодеки получили название "видео размером с почтовую марку" ("postage-stamp video") - клеймо, избавиться от которого удалось лишь недавно.
Если видео в Web вызывает у вас непреходящее ощущение чего-то уже пройденного, не удивляйтесь. Наш обзор двух ведущих потоковых видеопродуктов для Web, StreamWorks фирмы Xing Technology Corp. и VDOLive фирмы VDOnet, показывает, что создатели видеокодеков вновь предлагают зернистое, в сильной степени искаженное видеоизображение с низким разрешением. Но на этот раз видео воспроизводится с частотой, едва достигающей одного-двух кадров в секунду при использовании 28,8-кбит/с канала связи.
Хотя по итогам нашего обзора потоковых аудиотехнологий можно прийти к заключению об их полезности в широком спектре каналов связи, различающихся полосой пропускания, наши выводы относительно потоковых видеопродуктов не столь обнадеживающи. По мнению конечного пользователя, видео в Web - интересный эксперимент, еще не готовый дл широкого практического применения, за исключением наиболее быстрых каналов связи с Internet. С точки зрения разработчика, техническая сложность возникших перед ним проблем очень велика.
Нельзя сказать, что потоковые аудиотехнологии более совершенны; скорее, верно обратное. Дело в том, что перед потоковыми видеокодеками стоит намного более сложная задача. Сжатие аудиосигнала, имеющего качество звучания, характерное для компакт-диска (рассчитанного на полосу пропускания 176 Кбайт/с), до уровня, пригодного для передачи по 14,4-кбит/с каналу связи, требует эффективного коэффициента сжатия приблизительно 97:1. Некоторые аудиокодеки используют в качестве исходного сигнала низкокачественные, 8-кГц, 16-разрядные аудиосигналы, которые нужно сжать всего лишь примерно в 8 раз для передачи по каналу связи с полосой пропускания 14,4 кГц.
В противоположность этому сжатие видеосигнала телевизионного качества, исходная полоса пропускани которого составляет около 27 Мбайт/с, до пригодного к использованию значения 28,8 кбит/с, требует ошеломляющего коэффициента сжатия 7500:1. Даже если ограничиться маленьким видеоокном размером 160x120 пиксел, то для того, чтобы сделать 28,8-кбит/с соединение работоспособным, понадобится коэффициент сжатия 470:1. Такое огромное сжатие, достижимое лишь с помощью методов, сопряженных с потерей части исходной информации, вызывает сильные искажения в виде размытости, зернистости и появления крупных артефактов. Мы обнаружили, что качество несколько улучшается при коэффициентах сжатия, пригодных для 64-Кбит/с соединений (одноканальная ISDN), и оказывается еще лучше при 128-Кбит/с (двухканальная ISDN). Однако при скоростях, обеспечиваемых модемами, данная технологи оказывается почти непригодной для использования.
Не мешает также вспомнить, что в качестве информационной среды видеоинформация гораздо требовательнее, чем звук, как с технической, так и с художественной точки зрения. Вы можете добитьс поразительно хорошего аудиоэффекта в тихой комнате с микрофоном ценой 35 долл. и звуковой платой Sound Blaster ценой 200 долл. Для того же, чтобы создать видеофильм хорошего качества, потребуютс соответствующий уровень актерского мастерства, освещенности, постановки и наличие профессионального оборудования, даже если в вашем распоряжении така роскошь, как CD-ROM с двукратной скоростью. Дл видеофильмов, сделанных в расчете на 28,8-, 64- и даже 128-кбит/с каналы связи, высокие производственные стандарты несомненно играют исключительно важную роль.
В целом авторы Web должны определить минимальные требования к артистическому и техническому уровню материалов, оценив принципиальное назначение видеоинформации, которую предполагается направить определенной аудитории. Они должны дать взвешенный ответ на вопрос, достижимо ли необходимое качество при скоростях соединений, обычно используемых такой аудиторией.
Если вы нуждаетесь в звуке и движущихс изображениях, но требования к качеству видеоинформации слишком высоки, то существует ряд альтернатив, пригодных для заполнения образовавшегося разрыва. Например, программа Shockwave позволяет вам встроить в страницы Web средства мультимедиа-мультипликации Macromedia Director, а программа QuickTime VR фирмы Apple дает возможность создавать впечатляющие картины виртуальной реальности, в которой пользователи могут свободно перемещаться (оба продукта обсуждаются во врезках).
В данный обзор потоковых видеотехнологий было решено включить продукты, распростанявшиеся ко времени проведения испытаний через коммерческие каналы сбыта или по сети Web. Наш поиск позволил обнаружить лишь две программы, удовлетворявшие данному критерию: StreamWorks фирмы Xing Technology Corp. и VDOLive фирмы VDOnet Corp. Наши тесты показали, что эти два резко различающихся между собой продукта очерчивают внешние границы, внутри которых окажется большинство продуктов будущего рынка.
Сильнее всего бросалась в глаза разница в подходах к обеспечению качества узкополосного видео. Видеофильм имеет два фактора, оказывающие влияние на общий результат: абсолютное качество отдельных кадров и частота обновления экрана или число кадров, воспроизводимых в секунду (кадр/с). Проектируя кодек для низкоскоростных соединений, разработчики должны выбрать в качестве приоритетного один из них, поскольку невозможно одновременно обеспечить и высокое качество кадров, и высокую частоту обновления изображения при скорости передачи данных 28,8 кбит/с.
StreamWorks нацелена на высокое качество при низкой частоте кадров, тогда как в программе VDOLive отдаетс предпочтение полной передаче движения при худшем качестве кадра. Было интересно посмотреть, как этот выбор влиял на качество передачи изображений, в большей или меньшей степени насыщенных движением, и как каждый продукт проявил себя на лабораторных испытаниях и в реальной Internet.
Чрезвычайно узкополосные соединения, с которыми работают оба продукта, диктуют выбор алгоритма сжатия. В программе StreamWorks используется алгоритм, производный от метода MPEG-1, а VDOLive полагается на собственный волновой (wavelet) алгоритм. Реализованный в StreamWorks подход дает ей доступ к имеющей статус промышленного стандарта, проверенной рынком аппаратуре для сжатия данных в реальном масштабе времени, что критически важно для широковещательного рынка, на который делает однозначную ставку фирма Xing. Он дает StreamWorks возможность создавать аудио/видео потоки со скоростью передачи данных от 28,8 кбит/с до 150 Кбайт/с.
Однако доморощенному волновому алгоритму VDOLive изначально присуща масштабируемость - качество, способное стать ключом к будущему узкополосного видео. И хотя алгоритм является фирменным, рабочая среда программы VDOLive - нет. Компания приняла мудрое решение работать в рамках спецификации AVI стандарта Video for Windows корпорации Microsoft. Благодаря этому VDOLive будет иметь доступ к зрелым наборам инструментов регистрации и редактирования изображения, таким, как Adobe Premiere, Smart Video Recorder фирмы Intel и MediaStudio Pro фирмы Ulead Systems.
Хотя будущее принесет нам много новшеств, эти два инструмента олицетворяют собой доступный в настоящее время авторам выбор видеосредств для Web. Будет интересно узнать, насколько эффективным окажется каждый из этих подходов.
Потоковая видеотехнология Streamworks обладает уникальными достоинствами, свойственными также аудиопродукту Streamworks фирмы Xing Technology. Способность описываемого продукта одновременно пересылать в реальном масштабе времени аудио/видео файлы группе пользователей, сетевые адреса которых имеют общий префикс, делает его единственным реальным выбором для подобных применений, а его серверное программное обеспечение позволяет осуществлять произвольный доступ к видеопотоку - возможность, отсутствующая в конкурирующем продукте VDOLive. В программе Streamworks больше внимания уделяетс качеству кадров, а не частоте обновления изображения на экране, что дает возможность получить высококачественные кадры, которые зачастую более похожи на слайд-шоу, чем на видеофильм.
Цены на Streamworks назначаются в зависимости от полосы пропускания канала связи с сервером и лежат в диапазоне от 3500 долл. за 1,5-Мбит/с соединение до 50 тыс. долл. за 1600-Мбит/с соединение.
Метод кодирования Streamworks требует использовани сдаваемой фирмой Xing "под ключ" аппаратной системы AVTRANS (цена 6500 долл.), представляющей собой ПК на базе процессора Intel, на котором работает рассчитанный на среду DOS кодер, выполняющий сжатие аудио- и видеоданных в реальном масштабе времени. Система может передавать видео в процессе сжатия или сохранить сжатый поток на UNIX-сервере для последующей передачи.
Система AVTRANS предусматривает три метода сжати звука: MPEG-1 и MPEG-2 (отвечающие требованиям спецификации ISO) и LBR (Low Bit Rate - низкая скорость передачи двоичных данных) - формат, используемый в потоковых аудиотехнологиях. Она позволяет использовать широкий диапазон видеоконфигураций - от 96x96- до 352x240-пиксел при частоте кадров 24 и 30 кадр/с. Программа Streamworks предоставляет в ваше распоряжение отдельные средства управления скоростью передачи данных аудио- и видеокомпонентами в пределах от максимальной скорости передачи комбинированных данных 150 Кбайт/с до 14,4 кбит/с.
Фирма Xing использует алгоритм сжатия, производный от MPEG-1, и предоставляет пользователю возможность выбора между формированием последовательностей из кадров инфраструктуры (I-кадры), предиктивных кадров (P-кадры) и кадров, получаемых методом двунаправленной интерполяции, (B-кадры); в алгоритме сжатия MPEG разные типы кадров используются для обеспечения приемлемого качества изображения. При низких скоростях передачи данных программа Streamworks отбрасывает B- и P-кадры, передавая лишь более высококачественные I-кадры. Данна схема предоставляет практически ничем не ограниченные возможности управления числом и качеством кадров, передаваемых системой каждую секунду.
Например, тот, кто нуждается в получении высококачественных кадров размером в четверть экрана, может настроить видеотракт на разрешение 320x240 с передачей одного I-кадра в секунду. При передаче со скоростью 28,8-кбит/с экран может обновляться всего один раз каждые четыре-пять секунд, но качество кадра по-прежнему остается стабильно высоким.
Всякий раз, когда система отбрасывает кадры, она пропускает все B- и P-кадры, наиболее страдающие при воспроизведении движения в системе сжатия MPEG. В сущности, это означает, что движение оказывает малое или вообще не имеет никакого влияния на качество видеоизображения при узкой полосе пропускания. Это было подтверждено нашими тестами, в которых использовались последовательности кадров как с большой, так и малой насыщенностью движением.
Фирма Xing использует похожий метод, чтобы обслуживать запросы на передачу одного файла с различными скоростями. Например, широкополосная сеть или соединение T1 могут воспроизводить сохраненный файл с максимальной частотой кадров, в то время как 28,8-кбит/с соединение может получать один кадр каждые 4 или 5 с.
На тестах PC Labs со скоростью передачи данных 14,4 кбит/с индивидуальные кадры были слегка зернисты и размыты, а обновление кадров происходило каждые 10 или 12 с. При скорости передачи данных 28,8 кбит/с качество кадра несколько ухудшалось, но обновление кадров происходило каждые две-три секунды.
Качество кадров повысилось при скорости 64 кбит/с, а кадровая частота возросла примерно до 1 кадр/с, удвоившись до 2 кадр/с при том же качестве изображени на скорости 128 кбит/с. При сетевых скоростях передачи данных все кадры демонстрировались с привычным качеством MPEG-1. В целом мы отметили лишь малые различия или полное отсутствие разницы в качестве между видеоклипами с высокой и малой насыщенностью движением. В этом заключалось резкое отличие от того, что мы увидели при работе с продуктом VDOLive, где содержание видеофильма оказывало заметное влияние на качество воспроизведения. Продукт Xing в целом хорошо проявил себя на тестах с участием реальных серверов - поставщиков видеоинформации. В часы максимальной эксплуатационной нагрузки иногда отмечалась прерывистость звукового сопровождения.
Работа с системой кодирования фирмы Xing - занятие для людей неробкого десятка. Система сжатия AVTRANS была снабжена явно недостаточной документацией, а в руководстве отсутствовали критически важные разделы. Сервер StreamWorks поставляется без документации.
Однако, будучи запущенной в работу, система функционировала безукоризненно. Сервер, проигрыватель и средства интеграции страниц StreamWorks идентичны аналогичным средствам аудиотехнологии StreamWorks (подробности см. в предшествующей части, посвященной звуковым технологиям).
В целом подход фирмы Xing, сочетающий высокое качество изображения с невысокой частотой обновлени экрана, гарантирует, что каналы Internet не станут источником безобразных картинок. Несмотря на то что наилучшим образом StreamWorks подходит пользователям ISDN и еще более быстрых систем связи, качество изображений поддерживается на приемлемом уровне даже при скорости передачи данных 28,8 кбит/с, хотя и при низких частотах обновления кадров, заставляющих вспомнить о слайд-шоу. Для применений, требующих произвольного доступа к видеопотоку, и для кодировани и передачи видеоинформации в реальном масштабе времени данный продукт не имеет альтернативы.
StreamWorks
Цена, рекомендуемая изготовителем: зависит от ширины полосы пропускания канала связи с сервером.
Xing Technology Corp., Arroyo Grande, CA; 805-473-0145; fax, 805-473-0147;
http://www.xingtech.com.
Масштабируемый волновой алгоритм сжатия, динамическое управление полосой пропускания и использование получившего статус промышленного стандарта формата Video for Windows обеспечили фирме VDOnet прочную базу для достижения долгосрочного успеха на рынке средств узкополосного видео. Однако, работая с ее потоковым видеопродуктом (VDOLive) мы то тут, то там сталкивались с трудностями, в том числе с несовместимостью с большинством имеющихся в настоящее время инструментов Video for Windows и разочаровывающим проигрывателем, в котором не предусмотрено никаких средств произвольного доступа. Он обеспечил прекрасное качество изображения на быстродействующих линиях связи, но показал неоднородные результаты на одноканальной ISDN и более медленных соединениях.
Волновой алгоритм, используемый программой VDOLive, в настоящее время очень популярен среди специалистов по сжатию данных как благодаря его хорошим показателям при работе с узкополосными каналами связи, так и изначально заложенной в него способности к масштабированию. Реализация алгоритма в программе VDOLive делит видеокадр на несколько слоев, каждый из которых добавляет к изображению новые детали и повышает его качество. При наличии достаточно широкой полосы пропускания зрителю передаются все слои, и качество улучшается. При ограниченной полосе пропускани передается меньшее число слоев, что ухудшает качество видеоизображения, но сохраняет движение и сводит к минимимуму разрывы звукового сопровождения.
Такой подход позволяет фирме VDOnet создать один широкополосный файл - например, 256 кбит/с - который может быть использован для обслуживания запросов от потребителей, располагающих соединениями с быстродействием, не превышающим 14,4 кбит/с. Компани VDOnet дополняет свой волновой алгоритм серверным программным обеспечением, которое определяет действительную ширину пропускания канала связи клиента и динамически регулирует объем передаваемой информации. Таким образом производится настройка качества видеоизображения для каждого соединения и вместе с тем экономится полоса пропускания канала передачи данных, соединяющего сервер с Internet.
VDOLive - серверная система, цена которой зависит от обслуживаемого числа потоков. Цены - в пределах от 1199 долл. за 5 потоков до 9999 долл. за 100 потоков, ежегодная плата за техническое обслуживание составляет 30% цены продукта. При работе с VDOLive рекомендуетс использовать выделенный видеосервер.
Завершив инсталляцию программного обеспечени сервера, вы регистрируете расширение VDO в качестве MIME-типа на Web-сервере. Будучи файлами стандарта Video for Windows, все видеофильмы VDOLive имеют расширение AVI. Они встраиваются в страницу Web с помощью текстовых файлов-указателей с расширением VDO, указывающих местонахождение AVI-файла на видеосервере. Программа VDOLive использует собственный транспортный механизм UDP, обеспечивающий как контроль ширины полосы пропускания, так и коррекцию ошибок. У большинства систем защиты не возникает проблем с программой VDOLive, а ради устранения любых выявленных источников несовместимости компания сотрудничает напрямую с поставщиками средств защиты сетей от несанкционированного доступа.
Отдав предпочтение архитектуре Video for Windows, программа VDOLive предусмотрительно выбрала платформу с обширным набором инструментов захвата и редактировани видеоизображений. К сожалению, доступ к аудиокодеку VDOLive можно получить только через Диспетчер сжати звука (Audio Compression Manager) Windows 95, с которым могут работать лишь немногие инструменты редактировани Windows 3.11. Кроме того, аудиокодек VDOLive работает только с 8-кГц аудиоданными, на работу с которыми рассчитаны лишь немногие из современных устройств фиксации звука. Из-за этого VDOLive оказываетс несовместимым с большинством распространенных в настоящее время видеоредакторов, таких, как Adobe Premiere, - в ближайшее время компания намерена заняться решением этой проблемы.
В данный момент фирма VDOnet предлагает свои собственные инструменты: VDO Capture и VDO Clip. Они обеспечивают базовые функции регистрации и редактирования видеоизображений, но не располагают такими новыми средствами редактирования, как переходы и специальные эффекты. Инструмент VDO Capture совместим со всеми платами фиксации Video for Windows и хорошо работал с устройством записи Intel Smart Video Recorder.
Аудиокодек VDOLive осуществляет вывод данных только на скорости 8 кбит/с. Мы пришли к выводу, что звучание было отчетливым и ясным, не уступая качеству ряда ориентированных исключительно на звуковоспроизведение технологий на наших неформальных тестах или превосход его.
Программа сжатия предусматривает два варианта сжати видеоинформации, один из которых рассчитан на передачу через 28,8-кбит/с модем, а другой позволяет выбрать скорость передачи из диапазона значений от 8 до 256 кбит/с. Сжатие выполнялось сравнительно быстро; на преобразование 47-с тестового клипа в формат VDOLive на 133-МГц компьютере с процессором Pentium потребовалось немногим более 2 мин.
Мы испытывали процедуру сжатия видеоинформации на скоростях передачи комбинированных аудио/видео данных 28,8, 64 и 128 кбит/с. При скорости 28,8 кбит/с мы обнаружили, что насыщенные движением видеоклипы были сильно искажены и посечены, что свидетельствует о пропуске кадров в процессе сжатия с тем, чтобы уложиться в требуемую полосу пропускания. При той же самой скорости в клипах с малой насыщенностью движением также имелись очевидные искажения, хотя фильмы воспроизводились гладко без каких-либо признаков пропуска кадров.
При 64 Кбит/с (скорость одноканальной ISDN) насыщенные движением клипы оставались искаженными и продолжали пропускать кадры, хотя в малоподвижных клипах артефакты были значительно менее заметными. При 128 Кбит/с (скорость двухканальной ISDN) насыщенные движением клипы по-прежнему заметно искажались, но малоподвижные клипы почти освободились от артефактов.
Тесты в Internet принесли многообещающие результаты, однако не для пользователей с 28,8-кбит/с модемами. Воспроизведение файла с сервера VDOnet со скоростью 28,8 кбит/с обеспечило, согласно измерениям, выполненным с помощью проигрывателя VDOnet Player, пропускную способность от 12 до 20 кбит/с. При такой скорости передачи данных программа VDOLive выводила на экран примерно один-два кадра в секунду. Вид изображения стал значительно лучше, когда мы воспользовались одноканальным соединением ISDN (64 Кбит/с), где пропускная способность составила в среднем от 23 до 24 кбит/с, а на экран выводилось примерно 15 кадр/с.
Проигрыватель VDO Player может функционировать в среде Windows 95 и Windows 3.11. В начале 1996 г. можно ожидать появления версии программы для Macintosh и UNIX. Хотя внешний вид VDO Player вполне профессионален, ему недоставало одной ключевой характеристики: способности перемещаться в пределах клипа с помощью линейки с движком или кнопок быстрой перемотки. Зато проигрыватель предоставляет пользователю полезную статистическую информацию, в том числе данные о текущей пропускной способности канала связи и потерянных аудио- и видеокадрах. Он функционирует как вспомогательная прикладная программа и как автономный проигрыватель. В настоящее время этот проигрыватель отвечает требованиям спецификации внешних модулей Netscape 2.0, а к середине 1996 г. компани планирует добавить в него средства OLE для Microsoft Internet Explorer.
В целом VDOLive можно охарактеризовать как новую технологию, укомплектованную в хорошем пакете, но предъявляющую к каналу связи требования, превышающие возможности среднего пользователя Web. Она может, однако, оказаться чрезвычайно полезной для тех, кому необходимо передавать видеоинформацию пользователям, имеющим в своем распоряжении быстродействующие каналы связи.
VDOLive
Цена, рекомендуемая изготовителем: зависит от числа потоков.
VDOnet Corp., Santa Clara, CA; 408-654-8400; fax, 408-654-9447;
http://www.vdolive.com.
Как проводились испытания потокового видео
Анализ подготовил Джей Манро
Наши тесты потоковых видеопродуктов в меньшей степени базировались на формальные методы, нежели тесты аудиопродуктов. Мы стремились оценить, насколько хорошо каждый продукт был в состоянии приспособить качество видео- и звукового воспроизведения к соединениям, работающим на различных скоростях. Испытания проводились в лабораторной сетевой среде и с действующими информационными узлами в Internet.
Программу StreamWorks мы тестировали с использованием собственной, сдаваемой "под ключ" системы аудио- и видеокодирования AVTRANS фирмы Xing - функционирующего в среде DOS ПК с процессором 486 и встроенными средствами захвата аудио- и видеоинформации. Система AVTRANS выдавала необработанный поток аудио- и видеоинформации, который затем направлялся в Web с использованием сервера StreamWorks. Сервер StreamWorks был размещен на сервере Silicon Graphics Challenge Series. Тестирование кодера VDOLive проводилось на компьютер Gateway 2000 P5-133, который мы использовали дл направления видеопотока прямо на проигрыватель VDOLive. Серверное программное обеспечение VDOLive для персонального компьютера нами не испытывалось.
Тестирование проигрывателей обоих продуктов проводилось на системах Compaq 486/66M и HP Vectra XU 5/90C, работавших с интерфейсом Winsock Windows 95 и протоколом TCP/IP и подключенных к 10-Мбит/с сети Ethernet. Соединения между действующей Internet и нашей корпоративной магистральной сетью T1 были выполнены через 16-Мбит/с сеть Token-Ring. Коммутируемые соединения с нашим нью-йоркским поставщиком NetCom устанавливались с использованием 14,4-кбит/с и 28,8-кбит/с модемов PPI фирмы Practical Peripherals.
В ходе наших тестов сжатия были использованы два видеофрагмента, один из которых был насыщен движением, а другой представлял собой малоподвижную "говорящую голову". Мы сжали каждый видеофрагмент до целевых значений полосы пропускания при воспроизведении: 14,4 кбит/с, 28,8 кбит/с, 64 кбит/с (одноканальная ISDN), 128 кбит/с (двухканальна ISDN) и сетевых скоростей (T1). Затем мы оценивали качество воспроизведения, обеспечиваемое обоими продуктами для всех значений полосы пропускания, проверяли качество отдельных кадров и эффективную кадровую частоту, а также оценивали искажения типа размытости, зернистости и значительных артефактов.
Наконец, мы использовали проигрыватели обоих продуктов для доступа к подходящим информационным узлам Web на скоростях 28,8 кбит/с, 64 кбит/с и T1 в любое время суток, чтобы выяснить, насколько они способны смягчить нежелательные эффекты при уменьшении пропускной способности канала связи. -
+ ДА - НЕТ | StreamWorks | VDOLive |
---|---|---|
Сервер | ||
Цена программного обеспечения сервера, долл. | 1,5-Мбит/с серверное соединение, 3500; 1600 Мбит/с, 50 000 | 10 потоков, 1995; 100 потоков, 9999 |
HPUX/LINUX/BSDI | + + + | - + + |
Платформа Macintosh, OS/2 | - - | - - |
SGI/Sun Solaris/SunOS 4.x | + | + |
Windows NT | - * | + |
Дистанционный контроль | Через telnet | Через telnet |
Протокол передачи | UDP | TCP, UDP |
Одновременная пересылка аудио/видео файла группе пользователей | + | - |
Кодер | ||
Цена, долл. | 6500 | Поставляется бесплатно вместе с сервером |
Windows 95, Windows 3.x | N/A | + - |
DOS, OS/2, Unix | N/A | - - - |
Кодирование в реальном масштабе времени | + | - |
Форматы входных файлов | Составной аналоговый видео | AVI |
Предварительно устанавливаемая полоса пропускания, кбит/с | от 28,8 до 256 (масштабируется) | от 14,4 до 256 (масштабируется) |
Алгоритм сжатия | MPEG-1 | Волновой |
Пакетная обработка | - | - |
Проигрыватель | ||
Цена | Бесплатно | Бесплатно |
Программа рассчитана на Windows 95/3.x/NT | - + - | + + - |
Программа рассчитана на OS/2 | - | - |
Программа рассчитана на UNIX | + | - * |
Программа рассчитана на Macintosh | + | - * |
Использование как автономной программы | + | + |
Использование как вспомогательной прикладной программы | + | + |
Использование как сменного модуля Netscape 2.0 | + | + |
OLE | + | + |
Минимальная рекомендуемая скорость соединения, кбит/с | 9,6 | 14,4 |
Размер загружаемого из сети файла декодера, Мбайт | 1,4 | 0,4 |
Максимальное разрешение, пиксел | 352x240 | 240x180 |
Установки частоты кадров | 24 или 30 | 15 |
Встроенная линейка состояния | + | + |
Индикатор времени | + | + |
Воспроизведение с любого места | + | - |
Останов и возобновление воспроизведения | - | - |
Регулятор громкости | + | + |
Перемотка назад/вперед | - - | - - |
Перестраиваемый размер буфера | - | + |
Локальная/Web оперативная подсказка | + + | + + |
Проигрыватель работает надежно | + | + |
Shockwave for Director фирмы Macromedia
Рик Эйр
Дать определение продукту Shockwave for Director фирмы Macromedia несложно: это внешний модуль дл Netscape Navigator, воспроизводящий файлы Macromedia Director, загружаемые из Internet. Но то, что эта программа делает со страницами Web, описать почти невозможно. Благодаря ей они оживают, наполняютс звуками, цветной мультипликацией, движущимис изображениями и, самое важное, обретают способность интерактивного контакта с пользователем - все это отличительные качества, принесшие известность авторским средствам мультимедиа- фирмы Macromedia. Shockwave превращает Web в интерактивную среду, которую языки, подобные Java, могут обещать лишь в будущем.
Программа Shockwave имеет много схожих черт с рассмотренными в данном обзоре аудио- и видеотехнологиями. Например, она представляет собой кодек с двумя компонентами. Ее кодер Afterburner - это постпроцессор, который сжимает ("shocks" - утрясает) файлы Director с целью ускорить их передачу через Internet. Проигрыватель Shockwave загружает сжатые файлы Director и оперативно (динамически) распаковывает их. Воспроизведение в среде браузера Navigator происходит безупречно, поэтому элементы Shockwave выглядят органичной составной частью страницы.
Имеются, однако, и различия. Так, Shockwave не использует кодек, выполняющий сжатие с потерей части исходной информации. Файл, получаемый на приемной стороне, идентичен подлиннику, созданному в среде Director. Это ограничивает коэффициент сжатия, которого может достичь Afterburner, и файлы Shockwave, как правило, имеют большой размер. В настоящее время Shockwave не относится и к числу потоковых технологий, и прежде чем начнетс воспроизведение, необходимо загрузить весь файл целиком. Передача больших файлов не вызывает серьезных проблем для быстрых соединений Internet, однако каналы связи, оснащенные модемами, оказываются болезненно медленными.
Когда статья была подготовлена к печати, имелс только внешний модуль Shockwave Plug-In дл программы просмотра Web Netscape Navigator для среды Windows 3.1x и Windows 95. Внешние модули для других браузеров Windows и версия для Macintosh должны появиться в скором времени, возможно, к моменту, когда журнал с этой статьей поступит к читателям. Внешний модуль Plug-In можно бесплатно загрузить из Web-сервера фирмы Macromedia (http://www.macromedia.com).
Технология QuickTime VR фирмы Apple: почти виртуальная реальность
Рик Эйр
QuickTime - это межплатформенный стандарт фирмы Apple Computer Corp., предназначенный для создания и использования, в том числе совместного, видеоинформации, музыки, текста и мультипликации. Однако технология QuickTime VR представляет собой нечто большее. Она вводит вас в круговой (панорамный) виртуальный мир, заключенный в рамках окна, перемещаться в котором можно по любому азимуту. Для путешествия по виртуальному миру используются клавиши управления курсором или мышь.
QuickTime VR в Web - это технология загрузки из сети и воспроизведения информации; проигрыватель реализован в виде вспомогательной прикладной программы. Встретив QuickTime-файл на странице Web, вы щелкаете на связи, загружаете файл и запускаете программу просмотра QuickTime, чтобы посмотреть видеофильм. Размер типичного файла может составлять от половины до целого мегабайта, и его загрузка через сеть требует соответственно длительного времени. Однако результаты стоят времени, потраченного на ожидание.
Большинство сцен QuickTime VR создаютс фотографически. Используя 35-мм фотокамеру с 15-мм объективом, автор делает серию снимков, поворачива камеру на один и тот же угол (обычно 30o) после каждого снимка. Затем фотостудия создает монтаж из полученных фотографий. Наконец, QuickTime VR создает панораму, деформируя изображения, налагая их друг на друга и объединяя в единую картину. Объекты могут быть сфотографированы из центральной точки; можно также использовать камеру, движущуюся вокруг расположенного в центре объекта.
Для просмотра изображений QuickTime VR вам понадобятся программа QuickTime for Windows и модуль расширения QuickTime VR - и то и другое можно получить бесплатно с Web-сервера Apple (http://qtvr.quicktime.apple.com/). Информация о том, как заказать набор авторских инструментов QuickTime VR Authoring Tools Suite, Version 1.0.2, имеется на том же сервере (тел. 800-282-2732). Со временем как QuickTime, так и QuickTime VR будут поставляться в виде сменных модулей и вспомогательных прикладных программ.
На нашем снимке показан пример навигации в мирах Майкла Раду, созданных с использованием пакета KPT Bryce 1.0.1 (http://qtvr.quicktime.apple.com/Radu.htm). Сегодня технология QuickTime VR применяется дл показа чего угодно - от искусственных миров до модной одежды. Она позволяет вам приблизиться к виртуальной реальности настолько, насколько это возможно без специальных очков и перчаток.
Телефоны и видеоконференции Internet
Кейд Мец
Если вы располагаете соединением с Internet, то можете вести аудио- и видеопереговоры, не платя при этом ни цента своей междугородной АТС. Ряд компаний разработали программные телефоны на базе протоколов IP, которые посылают и принимают сжатые речевые сообщения через Internet в реальном масштабе времени, а Корнеллский университет и фирма White Pine Software предлагают еще "тепленький" продукт для проведения видеоконференций, работающий через протокол IP.
Если у вас есть дуплексная звуковая плата, то любой из шести рассмотренных нами IP-телефонов даст возможность делать телефонные вызовы, в ходе которых передача и прием речевых сообщений ведутс одновременно в реальном масштабе времени. При эксплуатации в сочетании с полудуплексными звуковыми платами эти продукты более похожи на приемопередатчики CB (citizen band - полоса частот, отведенная для персональной радиосвязи), чем на телефоны, но они все же дают возможность делать бесплатные междугородные вызовы. В дополнение к звуковой плате вам понадобится соединение с Internet через модем со скоростью передачи данных по меньшей мере 14,4 кбит/с, стандартный интерфейс Winsock, динамики, микрофон и кто-то с аналогичным комплектом оборудования на другом конце линии связи.
В отличие от других IP-телефонов, поставлявшихс к моменту передачи данной статьи в печать, продукт WebTalk (реальная розничная цена 50 долл.) фирмы Quarterdeck (http://www.quarterdeck.com) предлагает два различных способа вызова. В случаях когда продукт применяется в качестве автономной прикладной программы, он обслуживает только вызовы по протоколу "точка-точка"; вы просто вводите IP-адреса других пользователей и вызываете их напрямую. При использовании совместно с программой просмотра Web, WebTalk дает возможность вызывать других пользователей через сеть серверов, аналогичную системе ретрансляции разговоров (Internet Relay Chat, IRC). Получив доступ к локальной странице WebTalk Server Network, вы сможете выбрать им пользователя из цифрового каталога или "войти в переговорный зал". Оба способа вызова позволяют обмениваться сообщениями, вводимыми с клавиатуры, и в ближайшем будущем смогут сделать видеосвязь и доcку объявлений доступными для совместного использования. Программа WebTalk поставляется вместе с программой просмотра Web фирмы Quarterdeck и лицензией, разрешающей установку ее на двух компьютерах.
Возможности предлагаемого фирмой Third Planet Publishing (214-713-2630, http://www.planeteers.com) IP-телефона DigiPhone (цена 59,95 долл.) ограничены лишь вызовами по протоколу "точка-точка". На локальной странице Third Planet хранится полный каталог пользователей; но программа не может динамически связывать вас с этими пользователями; прежде чем сделать вызов, вам нужно вырезать конкретные имена из каталога и склеить их. Подобно большинству рассмотренных здесь продуктов, DigiPhone позволяет хранить имена наиболее часто вызываемых пользователей в персональной, разбитой на разделы телефонной книге, где их легко найти. Вы можете также шифровать свои вызовы, регулировать коэффициент сжатия и устанавливать частоту дискретизации. К сожалению, программа DigiPhone, поставляемая со своим собственным интерфейсом Winsock, не работает в среде Windows 95, но версия, которая сможет это сделать, возможно, появится к моменту, когда вы будете читать данную статью.
Продукт с подходящим названием Internet Phone фирмы VocalTec (http://www.vocaltec.com), напротив, позволяет вызывать других пользователей только через серверную сеть. Его набор из 12 серверных групп объединяет пользователей в различные тематические дискуссионные группы, к которым можно легко присоединяться и которые можно создавать заново. Наиболее часто вызываемым пользователям могут быть назначены индивидуальные кнопки быстрого набора Quick-Dial, встроенные в главное окно Internet Phone. В Web-сервере VocalTec предлагаютс полнофункциональная версия Internet Phone (цена 69 долл.) и бесплатная пробная версия программы, которой вы можете пользоваться 30 дней, но при этом длительность ваших разговоров ограничена 60 с.
Еще три IP-телефона во время печати данной статьи находились в стадии бета-тестирования, но все они будут поставляться к моменту, когда данный обзор выйдет в свет. Бета-версия программы CyberPhone, которую можно загрузить с Web-сервера CyberScience (http://magenta.com/cyberphone), позволяет делать вызовы по протоколу "точка-точка", обеспечивает доступ к сети переговорных серверов (chat servers), текстовым переговорным службам, возможности пересылки файлов и ретрансляции вызовов. В Программе CoolTalk фирмы InSoft (http://www.insoft.com) будут предложены текстовые переговорные службы и возможность работать с доcкой объявлений, прямой набор номера, автоответчик и средства поиска серверов. Фирма NetSpeak (http://www.itelco.com) в настоящее время предлагает бета-версию 5 своей программы WebPhone, которая позволяет делать вызовы лишь по протоколу "точка-точка", однако располагает телефонным справочником.
Доступный в настоящее время выбор IP-средств дл проведения видеоконференций более ограничен. Спуст некоторое время после выпуска программы CoolTalk фирма InSoft предложит продукт CoolView, дуплексный аудио- и видеопакет, способный обслуживать как текстовые переговоры, так и совместно используемые доски объявлений. Программа Enhanced CU-SeeMe фирмы White Pine Software (http://www.wpine.com) использует для показа видеофильмов в реальном масштабе времени через каналы Internet технологию, полученную по лицензии от команды разработчиков CU-SeeMe из Корнеллского университета. Бесплатный клиент CU-SeeMe, предназначенный и для Windows, и для Macintosh, позволяет посылать и принимать 24-бит изображения с истинной цветопередачей и 4-разрядные полутоновые изображения, равно как и звуковую информацию. Для того чтобы полностью реализовать функциональные возможности программы, вам потребуются по меньшей мере 28,8-кбит/с модем и камера со смешанным или S-видеовыходом.
Об авторах: Джан Озер (Jan Ozer) - президент компании Doceo Publishing (Норкросс, шт. Джорджия), разрабатывающей средства для испытаний цифровой видеотехники. Он также автор книги Video Compression for Multimedia и часто пишет для PC Magazine. Рик Эйр - исполнительный редактор, а Кейд Метц - штатный редактор PC Magazine. Томас Мейс - старший редактор, ответственный за подготовку обзора, Джей Манро был руководителем данного проекта.