Аналого-цифровое преобразование звуковых и видеосигналов
Среди методов цифрового представления ЗС наиболее известна импульсно-кодовая модуляция (ИКМ). Процедура преобразования аналогового сигнала в цифровой состоит из трех операций: дискретизации по времени, квантовании полученной совокупности отсчетов и замене квантованных значений сигнала последовательностью чисел (кодировании).
1. Дискретизация
Значение частоты дискретизации ограничивает разрешающую способность аналого-цифрового преобразования во времени и, следовательно, наивысшую возможную частоту на входе АЦП. Наглядной иллюстрацией этого служит рис. 1. Процедура дискретизации с одной и той же частотой fд представлена на рисунке одновременно для двух тональных сигналов низкой (F1 – сплошная линия) и высокой (F2 – штриховая линия) частот. В обоих случаях после дискретизации имеем идентичные временные последовательности значений отсчетов. Следовательно, сигналы этих двух частот F1 и F2 нельзя различить и после обратного преобразования правильно восстановить (реконструировать).
Рис. 1 Устройство, осуществляющее ИКМ (а), временная диаграмма процесса ИКМ (б), спектр дискретизированного сигнала (в)
В соответствии с теоремой отсчетов В.А. Котельникова неискаженная передача непрерывного (аналогового) сигнала с полосой частот 0…Fтах дискретной последовательностью его отсчетов возможна только в том случае, если частота fд связана с максимальной частотой Fmах исходного сигнала соотношением fд 2 Fтах.
Итак, если требуется передать синусоидальное колебание с частотой 20 кГц, то требуемая частота его дискретизации должна быть более 40 кГц, лишь в этом случае возможно точное восстановление непрерывного сигнала.
Рис. 2
Все сигналы, частота которых F >fд/2, при восстановлении интерпретируются неправильно и трансформируются в сигналы более низкой частоты.
Дискретизированный сигнал можно представить в следующих двух формах записи:
где s(t) – исходный аналоговый сигнал; Dt – интервал (период, шаг) дискретизации, причем Тд = D t = const; п = 0, 1, 2,…; d(t) – функция Дирака; d(т) – функция отсчетов, dп – моменты появления отсчетов ЗС.
При передаче ЗС или его обработке шаг дискретизации Тд не обязан быть одним и тем же в разных трактах канала или на разных стадиях обработки.
Рассмотрим теперь условия выбора частоты fд. Из рис. 2 следует, что чем больше fд по сравнению с Fтах, тем дальше в спектре дискретизированного сигнала разнесены частоты Fтах иfд и тем легче в ИКМ-демодуляторе отфильтровать полезный сигнал. В то же время скорость цифрового потока при ИКМ прямо пропорциональна значению fд. С точки зрения повышения эффективности канала связи при передаче сигналов 3В желательно насколько это возможно снизить fд. Однако выбор слишком низкого значения может привести к уменьшению допустимого значения Fтах и, как следствие, к ухудшению качества передачи. Поэтому значение fд выбирают исходя из компромисса между требуемым качеством звуковоспроизведения и допустимой скоростью цифрового потока. Влияют на выбор fд и системные факторы. Поскольку в системах связи сигналы 3В кодируются и передаются совместно с другими, например с телефонными сигналами, то частота дискретизации ЗС должна быть кратна частоте дискретизации телефонного сигнала. В противном случае в общей структуре цифрового потока системы связи невозможно обеспечить передачу более широкополосных сигналов 3В вместо нескольких телефонных. С учетом этих соображений при АЦП сигналов 3В в цифровых трактах первичного и вторичного распределений программ для ЗС с Fmах = 15 кГц принято значение fд = 32 кГц. что соответствует учетверенному значению fд для сигнала в телефонном канале.
В системах телевидения при передаче цифровых сигналов звукового сопровождения во избежание биений между гармониками строчной частоты и частоты дискретизации значение fд выбирается кратной частоте строчной развертки. В трактах формирования программ при Fmax = 20 кГц принято значение fд = 48 кГц, в лазерных проигрывателях и бытовых магнитофонах fд = 44,1 кГц.
Борьба с погрешностями цифрового преобразования из-за возможной нестабильности частоты дискретизации сводится к ограничению полосы частот ЗС фильтрами с полосой пропускания от 0 до Fmax на входе АЦП и выходе ЦАП и к выполнению требования теоремы В.А. Котельникова. Предъявляются жесткие требования к крутизне спада частотных характеристик ФНЧ за пределами полосы пропускания и стабильности частоты тактовых генераторов. Выполнение этих требований сегодня не вызывает трудностей.
2. Квантование
При квантовании непрерывному множеству мгновенных значений отсчетов аналогового сигнала ставят в соответствие конечное множество значений – уровней квантования. Иначе говоря, каждое значение отсчета заменяется ближайшим к нему разрешенным значением.
Расстояние между соседними разрешенными уровнями квантования называют шагом квантования. Процедуру квантования можно рассматривать как результат прохождения входного сигнала через устройство с амплитудной характеристикой ступенчатой формы (рис.), которая называется характеристикой (или шкалой) квантования. Если в пределах этой характеристики шаг квантования постоянен (Xi, – Xi-1 = D ═и Yi, – Yi-1 = D), то квантование называют равномерным (рис. 3). Этот простейший вид квантования широко используется в цифровой технике. Он удобен для начального цифрового представления ЗС с целью их последующей обработки, а также последующего сокращения избыточности цифровых сигналов при передаче их по каналам связи. Равномерное квантование часто служит также первым этапом для последующего неравномерного квантования.
Одним из наиболее важных показателей цифровых систем передачи аналоговых сигналов является величина отношения мощности сигнала Pс мощности шума квантования Ршкв на выходе ЦАП.
Определим значение Ршкв Для произвольной шкалы квантования.
Ршкв =12 /12
Отсюда следует важный вывод: при равномерном квантовании мощность шума квантования определяется исключительно шагом квантования и не зависит от величины сигнала. Поэтому при уменьшении уровня сигнала отношение мощности сигнала к мощности шума квантования снижается.
Рис. 3. Преобразование входных шумов в квантованное колебание в АЦП
Спектр шума квантования равномерный в полосе частот 0…fд/2. Шум квантования появляется только при наличии сигнала. При отсутствии сигнала на входе АЦП можно было бы ожидать, что на выходе ЦАП шум будет полностью подавлен. Однако наличие теплового шума входных аналоговых блоков АЦП, нестабильность напряжения питания, переходные помехи от соседних каналов, дрейф постоянной составляющей в усилителях постоянного тока и действие других факторов приводят к тому, что самый низкий первый уровень квантования достигается даже при отсутствии ЗС на входе АЦП.
На рис. 4 изображен начальный участок шкалы квантования и показано, как входные шумы преобразуются в АЦП в квантованное колебание. На выходе ЦАП это квантованное колебание превращается в шум, называемый шумом паузы. Шум паузы менее равномерный, чем белый шум, характерный для аналоговых систем. Его часто называют гранулированным. Мощность шума паузы Рш п=1 2═/4, т.е. на 4,7 дБ больше шума квантования.
Рис. 4
Наряду с частотой дискретизации точность передачи сигнала при его цифровом представлении зависит от того, как далеко отклоняется последовательность чисел после АЦП от истинных значений исходного аналогового сигнала (рис. 4). Квантование сигналов неизбежно сопровождается погрешностью. Разность между исходными и квантованными значениями отсчетов изображена на рис 4. Этот сигнал ошибок называют шумом квантования. Чем меньше величина шага Д при квантовании отсчетов дискретизированного сигнала, тем меньше по уровню этот шум квантования. Он возникает в результате детерминированного нелинейного преобразования входного сигнала и имеет неслучайный характер. Поэтому при квантовании правильнее говорить об искажениях, а не о шумах квантования.
Характеристика квантования (см. рис. 4 а) имеет две зоны: квантования при Uвх < Uогр и ограничения при Uвх > Uогр. Зона квантования является рабочей областью характеристики. В ее пределах выполняется квантование сигнала. Если мгновенное значение сигнала выйдет за пределы зоны квантования, то выходное напряжение будет оставаться неизменным и равным Uвыхmaxнезависимо от значения Uвх. Возникающие при этом искажения имеют характер безинерционного ограничения сигнала и считаются недопустимыми. Разность между исходным и ограниченным сигналами называют шумом ограничения. Итак, квантование – это безинерционно-нелинейное преобразование сигнала, при котором (в отличие от дискретизации) сигнал нельзя передать со сколь угодно малой ошибкой ни при каком конечном шаге квантования.
Определим отношение сигнал/шум (С/Ш) на выходе квантующего устройства
Pc/Pш кв = 3* n2 / k2
или в децибелах это выражение преобразуется к виду
Pc/Pш кв =201g (n/k)+4,8
При m-разрядном кодировании, учитывая, что п = 2m, преобразуем к виду
Рс / Ршкв=6m-201gk+4,8
При равномерном квантовании в случае увеличения числа разрядов т на единицу отношение С/Ш повышается на б дБ. В то же время, переход, например, от 14-разрядного кодового слова к 15-разрядному означает увеличение скорости передачи цифрового ИКМ-сигнала (Vпер =) всего лишь на 7%. Это свойство является важнейшей особенностью ИКМ с равномерным квантованием; ни один другой способ кодирования не позволяет так заметно улучшать помехозащищенность ЗС за счет сравнительно небольшого увеличения скорости передачи.
При равномерной шкале квантования и гармоническом сигнале, для которого, как известно, значение пик-фактора k = , отношение С/Ш квантования, дБ, на выходе квантующего устройства определяется соотношением Рс / Ршкв=6m+1,8.
Для сигнала ЗС значение пик-фактора зависит от жанра программы и меняется в пределах от 7 до 25 дБ. В среднем считают, что он равен 12…15 дБ, поэтому для вещательных сигналов имеем Рс / Ршкв = 6m – 8,2.
Заметим, что это выражение не учитывает неодинаковой чувствительности слуха к составляющим шума разных частот, определяемой псофометрическим коэффициентом. С его учетом отношение Рс / Ршкв еще уменьшается на 8,5 дБ для широкополосного ЗС с полосой частот 15 кГц и составляет Рс / Ршкв=6m – 16,7.
Для избежания ограничения сигнала его квазипиковое значение не должно превышать порога ограничения квантователя. Обычно его выбирают меньшим на величину D V= 6…10 дБ.
На рис. 5 представлены зависимости отношения сигнал/шум (Рс / Ршкв, дБ) для сигналов 3В при разных значениях т от относительного изменения уровня сигнала на входе. Здесь по оси абсцисс отложена разность между входным уровнем Nс и его квазимаксимальным значением Nсквтаx дБ.
Рис. 5
Выражение для отношения С/Ш определяет в конечном итоге значение максимального динамического диапазона ЗС, который может быть передан по цифровому каналу без появления искажений. На практике в трактах формирования программ звукозаписи обычно используется 16-разрядное равномерное квантование. При разрядности т кодового слова, равной 16 битам (размер кодового слова системы компакт-диска) формула дает нам значение 97,8 дБ. Однако отсюда следует вычесть величину приблизительно равную 1,5…2,0 дБ, определяющую дополнительные погрешности, свойственные аналого-цифровому и цифро-аналоговому преобразованиям. Далее в соответствии с Рекомендацией СС1К эту величину с учетом пик-фактора следует уменьшить еще на 12 дБ (при пересчете уровня мощности шумов квантования в величину, соответствующую получаемой при измерении). Для защиты канала от возможного превышения максимального уровня это значение уменьшают еще на 10 дБ. И наконец, чтобы избежать слишком больших погрешностей при квантовании низких уровней сигнала и обеспечить при обратном преобразовании маскировку шумов квантования полезным сигналом, его уровень должен превышать уровень шумов по крайней мере на 20 дБ. С учетом изложенных соображений получаем, что при т = 16 значение динамического диапазона исходного ЗС на входе цифрового тракта в этом случае не должно превышать ═ Dc = (6т + 1,8) – (1,5…2,0) – 12 – 20 = 54 дБ (рис. 5.б). Напомним, что после обработки звукорежиссером динамический диапазон ЗС обычно не превышает 40 дБ в радиовещании и 50 дБ при высококачественной звукозаписи, например на компакт-диск. При 16-разрядном кодировании и частоте дискретизации fд =48 кГц скорость передачи цифрового потока Vпер = mf/д составит для монофонического сигнала Vперм = 16 ∙ 48 = 768 кбит/с, а для стереофонического – соответственно Vперст = 2 (16 ∙ 48) = 1536 кбит/с. При fд = 44,1 кГц имеем соответственно Vперм = 705 кбит/с и Vперст =1411,2 кбит/с.
И последнее важное замечание. Общее разрешение АЦП ограничено как числом возможных ступеней квантования, так и временной точностью при дискретизации непрерывного сигнала. Если мгновенное значение сигнала изменяется очень быстро, то очевидно, что положение временной точки дискретизации существенно влияет на значение соответствующего ей отсчета. Так, ошибка в значении отсчета при частоте сигнала 1 кГц и временной неточности дискретизации, равной 160 мкс, соответствует ошибке квантования при 10-битовом разрешении. Очень трудно изготовить аналого-цифровой преобразователь с высокой точностью квантования и дискретизации. При непосредственном прямом АЦП с 16-разрядным разрешением и числом возможных уровней квантования, равным 65536. необходимо, чтобы сравниваемые в АЦП постоянные напряжения были бы очень точными. Это трудно выполнить, так как при максимальном значении амплитуды входного сигнала Uсквтax = 1 В для каждой отдельной ступени квантования требуется точность не менее 0,00001 В. Такая точность должна быть реализована в полосе частот ЗС, равной по меньшей мере 20 кГц.
Проблема реализации требуемой точности при аналого-цифровом преобразовании может быть упрощена, если использовать АЦП и ЦАП с более низкой разрядностью в сочетании с методом дельта-модуляции, являющимся одной из разновидностей дифференциальной ИКМ (ДИКМ). Простейший вариант дельта-модулятора изображен на рис. 5, а. Он содержит устройство дискретизации УД аналогового сигнала. компаратор К и интегратор И, являющийся простейшим предсказателем. Здесь осуществляется однопороговое квантование не самого сигнала, а разности между отсчетом сигнала s() и его предсказанным значением s*(), имеющим вид ступенчатой функции (рис. 5, б). На выходе компаратора имеем цифровой сигнал. Его значение соответствует 0, если разность двух сигналов на входе компаратора меньше некоторого порогового значения, и соответствует 1, если она превышает это пороговое значение.
Для ЗС с ограниченной скоростью изменения мгновенных значений условие малости приращений ступенчатой функции (рис. 5 б), а следовательно, и малых шумов квантования будет выполнено, если частота дискретизации fдо в несколько раз превышает значение fд. необходимое по теореме В.А. Котельникова. Повышение частоты дискретизации при соответствующей частоте среза ФНЧ приводит к уменьшению уровня шумов квантования в полосе частот полезного сигнала. Это уменьшение связано с тем, что при равномерном квантовании мощность шума квантования зависит только от шага квантования, а спектральная плотность шума квантования
Gшкв=(4 Pшкв)/ wдо
тем меньше, чем выше частота дискретизаций fдо/2p. При этом выигрыш в отношении сигнал/шум квантования может быть реализован, если в тракт кодер-декодер» введен ФНЧ с частотой среза Fср = fд/2. Тогда мощность шума квантования в полезной полосе частот
Ршкв=Pшкв (fд/fдо),
где fд – частота дискретизации, определяемая теоремой отсчетов В.А. Котельникова
Кодирование ЗС с повышенной частотой дискретизации имеет и другие достоинства. Оно полностью исключает эффект наложения спектров полезного сигнала и продуктов модуляции (см. рис. 5, б), что обеспечивает отсутствие комбинационных частот вида Fс+k (fдо-Fс) при последующей фильтрации. Отпадает также необходимость применения аналоговых ФНЧ высокого порядка на входе кодера и выходе декодера. Поэтому кодер имеет хорошие переходные характеристики и малое групповое время запаздывания при малой его зависимости от частоты. Однако для реализации выигрыша в величине шума квантования и перехода к стандартному значению частоты дискретизации (48 или 32 кГц) необходимо ограничить полосу частот с одновременным понижением fдо до значения fд.