Средства мультимедиа
Мультимедиа— это интерактивные системы, обеспечивающие работу с неподвижными изображениями и движущимся видео, анимированной компьютерной графикой и текстом, речью и высококачественным звуком.
Появление систем мультимедиа, безусловно, производит революционные изменения в таких областях, как образование, компьютерный тренинг, во многих сферах профессиональной деятельности, науки, искусства, в компьютерных играх и т.д.
Появление систем мультимедиа подготовлено как с требованиями практики, так и с развитием теории. Однако, резкий рывок в этом направлении, произошедший в этом направлении за последние несколько лет, обеспечен прежде всего развитием технических и системных средств. Это и прогресс в развитии ПЭВМ: резко возросшие объем памяти, быстродействие, графические возможности, характеристики внешней памяти, и достижения в области видеотехники, лазерных дисков — аналоговых и CD-ROM, а также их массовое внедрение. Важную роль сыграла так же разработка методов быстрого и эффективного сжатия и развертки данных.
Современный мультимедиа–ПК в полном “вооружении” напоминает домашний стереофонический Hi–Fi комплекс, объединенный с дисплеем–телевизором. Он укомплектован активными стереофоническими колонками, микрофоном и дисководом для оптических компакт–дисков CD–ROM (CD — Compact Disc, компакт–диск; ROM — Read only Memory, память только для считывания). Кроме того, внутри компьютера укрыто новое для ПК устройство — аудиоадаптер, позволивший перейти к прослушиванию чистых стереофонических звуков через акустические колонки с встроенными усилителями.
ВИДЕО
При смешении сигналов основные проблемы возникают с видео–изображением. Различные ТВ–стандарты, существующие в мире (NTSC, PAL, SECAM), применение разных мониторов и видеоконтроллеров диктует разнообразие подходов в разрешении возникающих проблем. Однако в любом случае требуется синхронизация двух изображений, для чего служит устройство генлок (genlock). С его помощью на экране монитора могут быть совмещены изображение, сгенерированное компьютером (анимированная или неподвижная графика, текст, титры), и “живое” видео. Если добавить еще одно устройство — кодер (encoder), компьютерное изображение может быть преобразовано в форму ТВ–сигнала и записано на видеопленку. "Настольные видео–студии”, являющиеся одним из примеров применения систем мультимедиа, позволяют готовить совмещенные видео–компьютерные клипы, титры для видеофильмов, помогают при монтаже кинофильмов.
Системы такого рода не позволяют как-то обрабатывать или редактировать само аналоговое изображение. Для того, чтобы это стало возможным, его необходимо оцифровать и ввести в память компьютера. Для этого служат так называемые платы захвата (capture board, frame grabbers). Оцифровка аналоговых сигналов порождает огромные массивы данных. Так, кадр стандарта NTSC (525 строк), преобразованный платой типа Truevision, превращается в компьютерное изображение с разрешением 512x482 пиксель. Если каждая точка представлена 8 битами, то для хранения всей картинки требуется около 250 Кбайт памяти, причем падает качество изображения, так как обеспечивается только 256 различных цветов. Считается, что для адекватной передачи исходного изображения требуется 16 млн. оттенков, поэтому используется 24-битовый формат хранения цветной картинки, а необходимый размер памяти возрастает. Оцифрованный кадр может затем быть изменен, отредактирован обычным графическим редактором, могут быть убраны или добавлены детали, изменены цвета, масштабы, добавлены спецэффекты, типа мозаики, инверсии и т.д.
Запись последовательности кадров в цифровом виде требует от компьютера больших объемов внешней памяти: частота кадров в американском ТВ–стандарте NTSC — 30 кадров/с (PAL, SECAM — 25 кадров/с), так что для запоминания одной секунды полноцветного полноэкранного видео требуется 20–30 Мбайт, а оптический диск емкостью 600 Мбайт вместит менее полминуты изображения. Но последовательность кадров недостаточно только запомнить, ее надо еще вывести на экран в соответствующем темпе. Подобной скоростью передачи информации — около 30 Мбайт / с — не обладает ни одно из существующих внешних запоминающих устройств. Чтобы выводить на экран компьютера оцифрованное видео, приходится идти на уменьшение объема передаваемых данных, (вывод уменьшенного изображения в небольшом окне, снижение частоты кадровой развертки до 10–15 кадров / с, уменьшение числа бит / пиксель), что, в свою очередь приводит к ухудшению качества изображения.
Более радикально обе проблемы — памяти и пропускной способности — решаются с помощью методов сжатия и развертки данных, которые позволяют сжимать информацию перед записью на внешнее устройство, а затем считывать и разворачивать в реальном режиме времени при выводе на экран. Так, для движущихся видео–изображений существующие адаптивные разностные алгоритмы могут сжимать данные с коэффициентом порядка 100:1— 160:1, что позволяет разместить на CD–ROM около часа полноценного озвученного видео.
Существует симметричная и асимметричная схемы сжатия данных. При асимметричной схеме информация сжимается в автономном режиме (т.е. одна секунда исходного видео сжимается в течение нескольких секунд или даже минут мощными параллельными компьютерами и помещается на внешний носитель, например CD–ROM. На машинах пользователей устанавливаются сравнительно дешевые платы декодирования, обеспечивающие воспроизведение информации мультимедиа в реальном времени. Использование такой схемы увеличивает коэффициент сжатия, улучшает качество изображения, однако пользователь лишен возможности разрабатывать собственные продукты мультимедиа. При симметричной схеме сжатие и развертка происходят в реальном времени на машине пользователя, благодаря чему за персональными компьютерами и в этом случае сохраняется их основополагающее достоинство: с их помощью любой пользователь имеет возможность производить собственную продукцию, в том числе и коммерческую, не выходя из дома. Правда, при симметричной схеме несколько падает качество изображения: появляются “смазанные” цвета, картинка как бы расфокусируется. С развитием технологии эта проблема постепенно уходит, однако пока иногда предпочитают смешанную схему, при которой разработчик продукта готовит, отлаживает и испытывает продукт мультимедиа на своей машине с симметричной схемой, а затем “полуфабрикат” в стандартном формате отсылается на фирму, где его подвергают сжатию на мощном компьютере, с использованием более совершенных алгоритмов и помещают результирующий продукт на CD–ROM.
В настоящее время целый ряд фирм активно ведет разработку алгоритмов сжатия видеоинформации, стремясь достичь коэффициента сжатия порядка 200:1 и выше. В основе наиболее эффективных алгоритмов лежат различные адаптивные варианты: DCT (Discrete Cosine Transform, дискретное косинус–преобразование), DPCM (Differential Pulse Code Modulation, разностная импульсно–кодовая модуляция), а также фрактальные методы. Алгоритмы реализуются аппаратно — в виде специальных микросхем, или “firmware” — записанной в ПЗУ программы, либо чисто программно.
Разностные алгоритмы сжатия применимы не только к видео–изображениям, но и к компьютерной графике, что дает возможность применять на обычных персональных компьютерах новый для них вид анимации, а именно покадровую запись рисованных мультфильмов большой продолжительности. Эти мультфильмы могут хранится на диске, а при воспроизведении считываться, распаковываться и выдаваться на экран в реальном времени, обеспечивая те же необходимые для плавного изображения 25–30 кадров в секунду.
При использовании специальных видео–адаптеров (видеобластеров) мультимедиа–ПК становятся центром бытовой видео–системы, конкурирующей с самым совершенным телевизором.
Новейшие видеоадаптеры имеют средства связи с источниками телевизионных сигналов и встроенные системы захвата кадра (компрессии / декомпрессии видеосигналов) в реальном масштабе времени, т.е. практически мгновенно. Видеоадаптеры имеют быструю видеопамять от 2 до 4 Мбайт и специальные графические ускорители процессоры. Это позволяет получать до 30–50 кадров в секунду и обеспечить вывод подвижных полноэкранных изображений.
АУДИО
Любой мультимедиа–ПК имеет в своем составе плату–аудиоадаптер. Для чего она нужна? С легкой руки фирмы Creative Labs (Сингапур), назвавшей свои первые аудиоадаптеры звонким словом Sound Blaster, эти устройства часто именуются “саундбластерами”. Аудиоадаптер дал компьютеру не только стереофоническое звучание, но и возможность записи на внешние носители звуковых сигналов. Как уже было сказано ранее, дисковые накопители ПК совсем не подходят для записи обычных (аналоговых) звуковых сигналов, так как рассчитаны для записи только цифровых сигналов, которые практически не искажаются при их передаче по линиям связи.
Аудиоадаптер имеет аналого–цифровой преобразователь (АЦП), периодически определяющий уровень звукового сигнала и превращающий этот отсчет в цифровой код. Он и записывается на внешний носитель уже как цифровой сигнал.
Цифровые выборки реального звукового сигнала хранятся в памяти компьютера (например, в виде WAV–файлов). Считанный с диска цифровой сигнал подается на цифро–аналоговый преобразователь (ЦАП), который преобразует цифровые сигналы в аналоговые. После фильтрации их можно усилить и подать на акустические колонки для воспроизведения. Важными параметрами аудиоадаптера являются частота квантования звуковых сигналов и разрядность квантования.
Частоты квантования показывают, сколько раз в секунду берутся выборки сигнала для преобразования в цифровой код. Обычно они лежат в пределах от 4–5 КГц до 45–48 КГц.
Разрядность квантования характеризует число ступеней квантования и изменяется степенью числа 2. Так, 8–разрядные аудиоадаптеры имеют 28=256 степеней, что явно недостаточно для высококачественного кодирования звуковых сигналов. Поэтому сейчас применяются в основном 16-разрядные аудиоадаптеры, имеющие 216 =65536 ступеней квантования — как у звукового компакт–диска.
Другой способ воспроизведения звука заключается в его синтезе. При поступлении на синтезатор некоторой управляющей информации по ней формируется соответствующий выходной сигнал. Современные аудиоадаптеры синтезируют музыкальные звуки двумя способами: методом частотной модуляции FM (Frequency Modulation) и с помощью волнового синтеза (выбирая звуки из таблицы звуков, Wave Table). Второй способ обеспечивает более натуральное звучание.
Частотный синтез (FM) появился в 1974 году (PC–Speaker). В 1985 году появился AdLib, который, используя частотную модуляцию, был способен играть музыку. Новая звуковая карта SoundBlaster уже могла записывать и воспроизводить звук. Стандартный FM–синтез имеет средние звуковые характеристики, поэтому на картах устанавливаются сложные системы фильтров против возможных звуковых помех.
Суть технологии WT–синтеза состоит в следующем. На самой звуковой карте устанавливается модуль ПЗУ с “зашитыми” в него образцами звучания настоящих музыкальных инструментов — сэмплами, а WT–процессор с помощью специальных алгоритмов даже по одному тону инструмента воспроизводит все его остальные звуки. Кроме того многие производители оснащают свои звуковые карты модуляторами ОЗУ, так что есть возможность не только записывать произвольные сэмплы, но и подгружать новые инструменты.
Кстати, управляющие команды для синтеза звука могут поступать на звуковую карту не только от компьютера, но и от другого, например, MIDI (Musical Instruments Digital Interface) устройства. Собственно MIDI определяет протокол передачи команд по стандартному интерфейсу. MIDI–сообщение содержит ссылки на ноты, а не запись музыки как таковой. В частности, когда звуковая карта получает подобное сообщение, оно расшифровывается (какие ноты каких инструментов должны звучать) и отрабатывается на синтезаторе. В свою очередь компьютер может через MIDI управлять различными “интеллектуальными” музыкальными инструментами с соответствующим интерфейсом.
Для электронных синтезаторов обычно указывается число одновременно звучащих инструментов и их общее число (от 20 до 32). Также важна и программная совместимость аудиоадаптера с типовыми звуковыми платформами (SoundBlaster, Roland, AdLib, Microsoft Sound System, Gravis Ultrasound и др.).
В новейшие звуковые карты входит цифровой сигнальный процессор DSP (Digital Signal Processor) или расширенный сигнальный процессор ASP (Advanced Signal Processor). Они используют совершенные алгоритмы для цифровой компрессии и декомпрессии звуковых сигналов, для расширения базы стереозвука, создания эха и обеспечения объемного (квадрофонического) звучания. Программа поддержки ASP Q Sound поставляется бесплатно фирмой Intel на CD-ROM “Software Developer CD”. Важно отметить, что процессор ASP используется при обычных двухканальных стереофонических записи и воспроизведении звука. Его применение не загружает акустические тракты мультимедиа компьютеров.
НОСИТЕЛИ ИНФОРМАЦИИ
Важной проблемой мультимедиа является обеспечение адекватных средств доставки, распространения мультимедиа–информации. Носители должны вмещать огромные объемы разнородной информации, позволять быстрый доступ к отдельным ее компонентам, качественное их воспроизведение, и при этом быть достаточно дешевым, компактным и надежным. Эта проблема получила достойное решение лишь с появлением оптических дисков различных типов. В первых системах мультимедиа были использованы аналоговые диски - их обычно называют “видеодисками”. Диаметр этих дисков 12 или 8 дюймов. Известны 12–дюймовые диски стандарта LV (Laser Vision), поддерживаемого Sony, Philips и Pioneer.
Информация записывается на лазерный диск по спирали, каждый виток этой спирали называется дорожкой. Существуют 2 способа записи информации на лазерные диски — CAV (Constant Angular Velocity, с постоянной угловой скоростью) и CLV (Constant Linear Velocity, с постоянной линейной скоростью). При записи CLV диски вмещают по 1 часу видео на каждой из сторон (диски CLV называют также “долгоиграющими”), однако их интерактивные возможности ограничены, поэтому они в системах мультимедиа используются редко, чаще применяются при записи фильмов.
Диск CAV вмещает на каждой дорожке один видеокадр (точнее, два полукадра, содержащие четные и нечетные строки кадра — телевизор работает в интерлейсном режиме, попеременно высвечивая четные и нечетные строки каждого кадра). Диск вращается с постоянной скоростью 30 об / с, обеспечивая необходимые для NTSC 30 кадров / с. Каждая из сторон диска имеет 54000 дорожек, т.е. вмещает 30 минут видео NTSC (диски для PAL — 37 минут). Каждый кадр имеет свой номер, или адрес, по номеру возможен прямой доступ к любому кадру. Кадры могут трактоваться как неподвижные изображения — для этого после завершения считывания дорожки устройство не переходит на следующую, а вновь считывает ту же самую); возможно также проигрывание с разными скоростями и в обратном направлении. Вместе с изображением записываются две звуковые дорожки, доступные, впрочем, только при просмотре кадров в режиме видео. Информацию на диске можно разбить на “части” — до 80 частей на каждой из сторон. Управляющая информация — номера кадров, номера частей — помещается в “бланковых” (невидимых) частях кадров.
Промежуточный, “аналого–цифровой” формат лазерных дисков — LVROM, илиAIV (Advanced Interactive Video, улучшенное интерактивное видео) — позволяет сочетать на одном диске аналоговое видео с цифровым звуком и данными.
Наконец, существуют разные типы чисто цифровых дисков: CD–ROM, WORM, стираемые. CD–ROM, как и цифровые аудио–компакт–диски CD–DA (Compact Disc — Digital Audio)имеют диаметр 5.25 дюйма; они вмещают 500–600 Мбайт информации и являются сейчас наиболее массовым цифровым средством доставки мультимедиа–информации.
CD–ROM диск — кружок из прозрачной пластмассы, поликарбоната, на одной из поверхностей которого нанесен тонкий светоотражающий слой. Этот серебристый слой хорошо виден с тыльной стороны прозрачного диска. В нем имеются микроскопические углубления - питы, созданные в процессе его копирования с оригинала.
Типичная длина пита 0.8 – 3.2 мкм, ширина 0.4 мкм, глубина 0.12 мкм, а расстояние между отдельными дорожками 1.6 мкм. На одном дюйме (2.54 см) поверхности диска размещается 16 тыс. дорожек (для сравнения — на одном дюйме магнитного диска помещается только 96 дорожек). Благодаря столь малым размерам битов обычный CD–ROM вмещает огромный объем информации — порядка 700 Мбайт. Новые типы дисков имеют на порядок больший объем и допускают запись информации пользователем.
Рабочей является только одна поверхность диска CD–ROM. Она защищена толстым слоем лака, на который обычно наносится красочная этикетка. В проигрывателе диск обращен этой стороной наружу. Противоположная (тыльная) сторона используется для считывания лазерным лучом. Луч проходит сквозь нее, так как основа диска — прозрачная пластмасса. Толщина диска 1.2 мм, внешний диаметр 120 мм, диаметр внутреннего отверстия 15 мм.
В проигрывателе имеется электродвигатель со следящей системой, обеспечивающей точное считывание дорожки лазерным лучом и неизменную линейную скорость считывания. Поэтому скорость вращения диска непостоянна и изменяется от 500 об. / мин. для внутренней части диска, с которой начинается считывание, до 200 об. / мин. для внешней. Специальный оптико–электронный блок имеет устройства для стабилизации излучения лазера, автоматической фокусировки, слежения за дорожкой при биении диска и выбора треков диска для считывания.
Для считывания информации с CD–ROM используется полупроводниковый диод с фокусирующей и следящей оптической системой. Внутренняя поверхность диска, на которую кладут диск на подставку (в кассету) дисковода, находится не в фокусе оптической системы лазерного излучателя. Диаметр светового пятна от лазера, создающего сходящийся конус света, порядка 1 мм. Поэтому умеренные загрязнения нерабочей поверхности, например, пылинки на ней, отпечатки пальцев и даже небольшие царапины практически не влияют на воспроизведение. В отличие от привычных жестких магнитных дисков, диски CD–ROM можно заменять в считанные секунды. А ведь один диск CD–ROM по емкости равен примерно 500–м обычным гибким дискам формата 3.5“ на 1.44 Мбайт. Экономия на дискетах является немаловажным достоинством мультимедиа.
Проигрыватели компьютерных компакт–дисков, обычно называемые CD–ROM–драйвами, бывают двух типов: внешние (со своим корпусом) и внутренние — встраиваемые в системный блок компьютера. Последние напоминают накопители на гибких магнитных 5.25–дюймовых дискетах и имеют одинаковые с ним размеры.
На передней панели дисковода CD–ROM обычно имеется кнопка Eject для выброса или плавного выдвижения поддона, индикатор Busy(занято), гнездо для подключения стереотелефонов и регулятор громкости, используемый при проигрывании звуковых дисков.
Полноценное “вооружение” мультимедиа–ПК требует подключения к нему множества внешних устройств: аудио– и видеоадаптеров, телевизионных и радио–тюнеров, дисководов CD–ROM, джойстиков, клавиатуры MIDI и т.д. Все они обслуживаются массой программных утилит — драйверов и нередко конфликтуют друг с другом. В этой связи крупные разработчики ПК объединили усилия в создании стандарта Plug and Play (включай и играй). Этот стандарт — обширный комплекс программных и аппаратных средств по полностью автоматической настройке конфигурации компьютера в соответствии с используемым с ним оборудованием.
Технология PnP (или Plug’n’Play) предполагает, что достаточно включить компьютер, как все аппаратные и программные средства автоматически оптимально настроятся и станут работать без сбоев и конфликтов.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. С. Новосельцев “Мультимедиа — синтез трех стихий”. Компьютер–Пресс, 7’91.
2. В. Дьяконов “Мультимедиа–ПК”. Домашний Компьютер, 1’96.
3. В.Э. Фигурнов “IBM PC для пользователя. Краткий курс” – М.: ИНФРА-М, 1998.