Квантовый шум. Шумы квантования и алиасинг. Эффекты конечной разрядности цифровых фильтров

Майоров В.П.
Семин М.С.

Цель данной статьи показать как выглядят изображения при различном отношении сигнал-шум. Это отношение является определяющим для оценки качества изображения и чувствительности камеры.

Квантовые шумы, как они есть

Ниже представлены примеры, иллюстрирующие как выглядят изображения при различных освещенностях. Яркость объекта выражена в количестве электронов, которые возникают в ячейке ПЗС матрицы в результате воздействия света. Оценкой качества изображения служит отношение сигнал-шум (S/N), замеренное на светлой части изображения.

В качестве телевизионной системы ввода использовалась система VS-CTT-085-60 изготовленная на основе CCD матрицы SONY ICX085AL . При расчетах принималось значение шума чтения 25 электронов (о шуме чтения см. ниже).

Исходное изображение - центральная часть телевизионной испытательной таблицы. Соотношение сигнал/шум - около 80. Размер этого изображения 256*256 пикселей.

Рис 1. Исходное изображение

Левые изображения - это изображения, учитывающие шум чтения матрицы (25 электронов), правые - это изображения при том же уровне освещенности, но при отсутствии шума чтения как такового. Можно сказать, что правая колонка изображений - это идеальный случай к которому можно приближаться бесконечно долго, но превзойти в принципе невозможно, потому что дальше все упирается в "квантовые шумы".

Уровень сигнала	Изображения при шуме чтения 25 электронов	Изображения без учета шума чтения
Сигнал 25 электронов	S/N=1
Сигнал 52 электрона	S/N=2
Сигнал 108 электронов	S/N=4
Сигнал 234 электрона	S/N=8
Сигнал 547 электронов	S/N=16
Сигнал 1400 электронов	S/N=32

Попробуем все это пояснить.

Шум на изображении, полученный с ПЗС матрицы, можно в упрощенном виде разделить на 2 основных компонента (на самом деле этих компонентов больше, но остальными в данном случае можно пренебречь):

шум чтения матрицы;
квантовый шум фотонов.

Шум чтения матрицы - это постоянная величина, которая определяется только схемотехникой CCD. К сожалению, фирма SONY на ПЗС матрицах которой мы производили все наши эксперименты, не сообщает этот параметр. Мы его просто замерили на нашей конкретной камере VS-CTT-085-60 и он получился равным 20-25 электронам. Похожие цифры мы встречали на сайтах зарубежных фирм-изготовителей камер на этой матрице.

Квантовый шум происходит от основополагающих свойствах всего сущего и в частности света. Кванты света распределяются в пространстве и во времени случайным образом. При этом число электронов, накопленное в ячейке, может быть определено с точностью до квадратного корня из их числа (статистика Пуассона).

При небольшом уровне яркости объекта наибольший вклад в шумы вносится шумом чтения матрицы. Этот шум определяет минимально возможный уровень сигнала, который может быть увиден.

При изображении составленном из 400-625 электронов, квантовый шум сравнивается с шумом чтения. При сигнале больше этой величины наибольший вклад в общий шум вносится "квантовым шумом фотонов". Изображения из последнего ряда очень близки, а ведь это только 7% (!!!) от максимальной емкости пикселя матрицы ICX085 (20000 э-1).

Заключение

Если продавец говорит Вам, что его супер-пупер камера имеет чувствительность 0.0хххх1 люкс - не забывайте спрашивать - а при каком соотношении сигнал-шум это все замерено?

Посмотрите на изображения и делайте выводы сами! Мы можем еще раз повторить - чудес в повышении чувствительности телекамер ждать не следует.

Если Вы при освещенности близкой к насыщению матрицы получили "шумное" изображение, то искать причину этих шумов в камере смысла не имеет.

Квантование сигнала по уровню является главной операцией аналого-цифрового преобразования сигнала и заключается в округлении его мгновенных значений до ближайших разрешенных. При равномерном квантовании, расстояние между уровнями квантования одинаково. При квантовании сигнала возникают ошибки, величина которых случайна и имеет равномерное распределение, не превышая значения половины шага квантования. Сигнал после квантования представляет собой сумму исходного сигнала и сигнала ошибки, который воспринимается как флуктуационный шум.

Защищенность от шумов квантования для наиболее слабых сигналов при равномерном квантовании:

–псофометрический коэффициент, равный для канала ТЧ величине 0,75;

–динамический диапазон сигнала, равный , дБ;

m – число разрядов в двоичном коде.

Таблица 5.2. Исходные данные

Уровни сигнала:

Динамический диапазон сигнала:

Необходимое число разрядов:

–разрядность кода при равномерном квантовании.

Число шагов для равномерного квантования будет:

Вывод: чтобы закодировать равномерным кодом с заданной защищенностью потребуется код с разрядностью .

5.2.2. Шумы неравномерного квантования

В реальных системах ИКМ используется неравномерное квантование. Неравномерное квантование – уменьшение наклона характеристики путем уменьшения величины шагов квантования для малых мгновенных значений сигнала за счет увеличения шагов для больших значений.

При неравномерном кодировании используются 8-ми разрядные коды, т.е. число уровней квантования равно 256.

Сжатие динамического диапазона осуществляется при помощи А - или m - характеристики компрессирования. В нашем случае используется характеристика компрессии , которая описывается следующим выражением:

Рис. 5.2.2. Характеристика компрессии

В ЦСП применяются сегментные неравномерные характеристики квантования, т.к. они достаточно просто реализуются на цифровой основе. Характеристика симметрична относительно 0, положительна и отрицательная ее ветви состоят из 8-ми сегментов, каждый сегмент поделен на 16 одинаковых шагов (внутри каждого сегмента квантование равномерное).

Сегменты аппроксимируют гладкую кривую характеристики компрессирования типа А. в нулевом и в первом сегменте шаг минимален, а в каждом последующем сегменте величина шага удваивается по отношению к предыдущему.

Выражение для защищенности от шумов квантования в двух первых сегментах будет иметь вид:

Для 2–7 сегментов:

где i - номер сегмента.

Начало графика – наклонная прямая – соответствует нулевому и первому сегментам. Это зона равномерного квантования, поэтому защищенность возрастает пропорционально увеличению уровня сигнала. При переходе ко второму сегменту защищенность скачком уменьшается на 6 дБ. При достижении верхней границы 7 сегмента наступает зона перегрузки.

Основным аспектом расчета и разработки инженерных проектов является необходимость использования аналитических характеристик качества функционирования систем. Только при наличии таких характеристик система может быть объективно оценена и ее стоимость эффективно сопоставлена со стоимостью альтернативных разработок. Одной из характеристик, наобходимой для инженеров телефонной связи, является качество речи, доставляемой слушателю. Измерения качества речи усложняются из-за субъективных свойств речи, которые воспринимаются типовым слушателем. Одна из особенностей субъективного восприятия шумов или искажений в речевом сигнале связана с частотным составом, или спектром мешающих воздействий в сочетании с уровнем их мощности. Эти эффекты влияния шумов в зависимости от частоты были рассмотрены в гл.1 при введении понятий взвешивания при помощи С-контура и псофометрического взвешивания.

Последовательные ошибки квантования в ИКМ-кодере в общем случае предполагаются распределенными по случайному закону и не коррелированными друг с другом. Таким образом, совокупный эффект ошибок квантования в системах с ИКМ можно рассматривать как аддитивные шумы, имеющие субъективное воздействие, которое аналогично воздействию белого шума с ограниченной полосой. На рис. 3.9 представлена зависимость ошибок кванования от амплитуды сигнала для кодера с равномерными шагами квантования. Отметим, что если сигнал успевает измениться по амплитуде на несколько шагов квантования, ошибки квантования становятся независимыми. Если сигнал дискретизируется с частотой, намного превышающей f s , то последовательные дискреты будут часто приходиться на одни и те же шаги, что приведет к потере независимости ошибок квантования.

Ошибки, или шум квантования, возникающие при преобразовании аналогово сигнала в цифровую форму, обычно выражаются в виде средней мощности шума по отношению к средней мощности сигнала. В соответствии с этим отношение сигнал-шум квантования можно определить как

ОСШК=E{x 2 (t)}/E{ 2 }, (3.1)

где E{. } – математическое ожидание, или среднее значение,x(t) – аналоговый входной сигнал,y(t) – декодированный выходной сигнал.

При определении среднего значения шума квантования необходимо сделать три замечания.

Ошибка y(t) –x(t) ограничена по амплитуде значениемq/2, гдеq– шаг квантования. (Декодированные выходные дискреты располагаются точно посредине шага квантования.)

Можно предположить, что значения дискретов с равной вероятностью могут попадать в любую точку в пределах шага квантования (предполегается равномерная плотность вероятности, равная 1/q).

Предполагается, что амплитуды сигнала ограничены рабочим диапазоном кодера. Если значение дискрета превышает границу наивысшего шага квантования, то возникают искажения, вызванные перегрузкой.

Если для удобства предположим, что нагрузочный резистор имеет сопротивление 1 Ом, то средняя мощность шума квантования (вычислена в приложении А) определяется выражением:

Мощность шума квантования = q 2 /12. (3.2)

Если все шаги квантования имеют равные значения (равномерное квантование) и шум квантования не зависит от значений дискретов, то отношение сигнал-шум квантования (в децибелах) определяется как

ОСШК = 10lg = 10,8 + 20lg(v/q), (3.3)

где v– среднее квадратическое значение амплитуды входного сигнала. В частности, для синусоидального входного сигнала отношение сигнал-шум квантования (в децибелах) при равномерном квантовании

ОСШК = 10lg[(А 2 /2)/(q 2 /12)] = 7,78 + 20lg(А/q), (3.4)

где А – амплитуда синусоиды.

Пример 3.1 Синусоидальный сигнал с амплитудой 1 В следует преобразовать в цифровую форму таким образом, чтобы получить отношение сигнал-шум квантования не менее 30 дБ. Сколько потребуется одинаковых шагов квантования и сколько потребуется разрядов для кодирования каждого дискрета?

Решение. С помощью формулы (3.4) определяем максимальный размер шага квантованияq=10 – (30 – 7,78) / 20 = 0,078B.

Таким образом, потребуется 13 шагов квантования для каждой полярности сигнала (общее число шагов квантования 26). Число разрядов, необходимых для кодирования каждого дискрета, определяется как n=log 2 26 = 4,75 разрядов на дискрет.

При измерениях мощности шума квантования спектральные составляющие часто взвешивают тем же способом, что и шумы в аналоговых каналах. К сожалению, измерения взвешенных шумов не всегда отражают подлинное качество восприятия речи, прошедшей кодер (декодер). Если спектральное распределение шумов квантования более или менее повторяет спектральное распределение сигнала речи, эти шумы значительно менее заметны, чем шумы, некоррелированные с речью . С другой стороны, если процесс квантования создает энергию на тональных частотах, отличных от тех, которые содержатся в конкретных звуках, эти искажения становятся более заметными.

Высококачественные ИКМ-кодеры создают шум квантования, который равномерно распределен в диапазоне ТЧ и не зависит от кодируемого сигнала. В этом случае отношение сигнал-шум квантования (3.4) является хорошей мерой качества ИКМ-преобразования. В некоторых видах кодеров, рассматриваемых далее (в особенности в вокодерах), знание мощности шума квантования не приносит большой пользы. В описаны другие характеристики качества речи, прошедшей через кодер, которые лучше определяют восприятие речи слушателем.

В диапазоне оптических частот тепловой шум оказывается очень слабым. Однако в этом диапазоне при слабых сигналах существенное значение имеет "квантовый шум", вызванный дискретной природой светового излучения. Согласно квантовой теории электромагнитного поля его энергия сигнала излучается и поглошается квантами, причём энергия одного такого кванта (фотона) равна . В элементарном сигнале длительности с высокостабильной несущей частотой (когерентное одномодовое излучение) и амплитудой детерминированной может быть только средняя энергия (пропорциональная ( - среднее число фотонов на интервале Т). Конкретная же реализация элементарного сигнала имеет энергию где случайное число регистрируемых фотонов.

В современных системах оптической связи в основном используется АМ оптического несущего колебания по амплитуде или интенсивности (мощности).

Идеальная система оптической связи при изохронной передаче двоичных сообщений (1 и 0) имеет следующие характеристики:

1. Время передачи бита (тактовый интервал) постоянен и равен следовательно, скорость передачи информации

2. При передаче 1 оптическая энергия, излучаемая в виде импульсов за время передачи одного бита, где число излучённых фотонов,

Энергия одного фотона (кванта), а оптическая энергия при передаче 0 равна нулю. Оптическая энергия в месте приёма равна на тактовом интервале величине при передаче 1 и нулю при передаче 0 соответственно.

3. Вероятности передачи . В этом случае усреднённую за продолжительное время принимаемую мощность можно выразить через среднюю мощность принимаемую за время передачи бита при посылке 1. Таким образом,

Реальная система оптической связи отличается от идеальной следующим :

1. Время передачи бита информации не остаётся постоянным - этот эффект называют фазовым дрожанием цифрового сигнала.

2. Излучаемая оптическая энергия не остаётся строго одной и той же. При передаче как кодовой 1, так и кодового 0 имеет место шум передатчика, приводящий к случайным изменениям амплитуды от импульса к импульсу. Кроме того, имеет место "шум лазера", обусловленный статистической природой взаимодействия между возбуждением лазера и создаваемым потоком фотонов. Флуктуации принимаемой энергии увеличиваются ещё больше из-за изменений затухания в канале связи. Кроме того, появляются флуктуации энергии на отдельных тактовых интервалах в месте приёма, обусловленные статистической природой взаимодействия потока фотонов (оптический сигнал) и создаваемого фотодетектором (обычно это фотодиод) потока электронно-дырочных пар. Условно будем говорить в этом случае о шуме фотодетектора.

3. Весьма вероятно, что при передаче 0 излучается малый, но вполне определённый уровень энергии (шум лазера), не считая шума передатчика и канала. Отношение средней энергии, принимаемой при передаче 0, к средней энергии при передаче 1 характеризуется коэффициентом Полагают, что в идеальной системе однако обычно это не так, особенно если лазерный источник излучения смещён вблизи порога генерации.

4. Конечная длительность излучаемых импульсов и дополнительная временная дисперсия (рассеяние) при их передаче по каналу приводят к тому, что в практических системах связи происходит наложение соседних посылок, т.е. проявляется межсимвольная интерференция.

Шум лазера, о котором говорилось выше, имеет квантовую природу. Вероятность появления точно фотонов на интервале на передающей стороне определяется распределением Пуассона (см. § 2.76):

Таким образом, шум лазера - это "квантовый шум", так как проявляется во флуктуациях параметров сигнала, детерминированного по классическим представлениям. Этот шум не является аддитивным, так как зависит от самого полезного сигнала. С учётом этого в приведённой формуле следует считать, что при передаче а при передаче Как указывалось выше, при передаче 0 (отсутствие возбуждения лазера) может наблюдаться определённый, хотя и малый уровень энергии, обусловленный тем, что вероятность непоявления фотонов на этом интервале где среднее число шумовых фотонов на интервале при отсутствии возбуждения лазера. По мере увеличения средней мощности излучаемого сигнала Рпер вклад квантового шума по сравнению с другими шумами тракта передачи падает.

Шум фотодетектора имеет природу, аналогичную шуму лазера, так как падающий на фотодиод стационарный световой поток генерирует электронно-дырочные пары носителей заряда как независимые случайные события. Если за отрезок времени на фотодиод падает оптическая энергия, равная в среднем то следует ожидать, что будет создано в среднем пар носителей заряда, причём

Однако логично предположить, что промежуточные участки волны, которые оцифровщику не удалось достоверно отобразить, не могут просто так исчезнуть.

Шумы квантования

Между аналоговым сигналом и его цифровой копией в вашей системе записи существует разница, которая называется ошибками квантования , или шумами квантования .

С помощью несложных математических формул можно вычислить частоту и уровень громкости шумов квантования. Также их характер можно проследить наглядно, если проанализировать отклонения графика оцифрованной волны от оригинальной синусоиды. На рисунке справа показана разница между исходным и оцифрованным сигналом.

Шумы квантования - это неотъемлемая составляющая цифрового звука, они возникают в момент оцифровки. Для минимизации влияния этих шумов на звук в конструкциях конверторов используются специальные фильтры. Покупая оцифровщик с более дорогими характеристиками (например, 24 /192 ), многие не обращают внимания качество этих фильтров, ориентируясь лишь на красивые численные характеристики разрядности и частоты дискретизации.

Чем выше показатели конвертора , тем дороже должны быть фильтры , однако именно на них производители обычно экономят, чтобы сохранить себестоимость на низком уровне и обеспечить себе конкурентоспособность.

Алиасинг

Еще одна неприятная вещь, которая может произойти в процессе семплирования (оцифровки) звука, называется алиасингом. Алиасинг - наложение двух непрерывных сигналов разной частоты друг на друга при семплировании, в результате которого в звуке возникают искажения.

Мы можем представить алиасинг даже визуально. Вспомните вращение колес автомобилей или поездов в старых фильмах. В определенные моменты можно отчетливо заметить, что колеса как бы крутятся в обратную сторону. И это не обман зрения, этот эффект появляется в моменты, когда частота вращения колес приближается к кадровой частоте кинокамеры (обычно это 24 кадра в секунду, но когда-то это значение было на уровне 16-20). Каждая точка колеса, двигаясь по часовой стрелке, успевает пройти почти полный оборот за один кадр, оказываясь с обратной стороны исходной точки, как будто эта точка сдвинулась против часовой стрелки. И мы видим обратное вращение.

В результате алиасинга записанный сигнал отличается от ожидаемого.

В соответствии с теоремой Котельникова , для восстановления сигнала без потерь семплирование должно производиться с частотой, в два раза превышающей самую высокую частоту в записываемом спектре.

То есть, скажем, если максимальная скорость вращения колес составляет 10 оборотов в секунду, то для устранения эффекта алиасинга фиксировать этот движение нужно с частотой не менее 20 кадров в секунду. А кинокамера – этот тот же семплер, только записывающий не звук, а изображение. При указанных значениях, как бы ни крутилось колесо, камера за один его оборот успеет сделать два семпла, а значит обратного вращения мы уже не увидим.

Так что если нам надо записать звук в пределах 20 кГц (верхний порог идентифицируемых человеческим ухом частот), то семплирование должно происходить с частотой дискретизации не менее 40 кГц.

При этом половина частоты дискретизации называется числом Найквиста (Найквист и Котельников – ученые, которые независимо друг от друга занимались исследованиями данной проблемы).

Однако мы знаем, что даже если наше ухо не распознает какие-то частоты, это еще не значит, что их нет. А раз они есть, то семплер (оцифровщик) попытается их зафиксировать, работая при этом на недостаточной для записи этого спектра частоте дискретизации. И возникнет алиасинг.

Чтобы устранить негативный эффект от алиасинга, при семплировании требуется частота дискретизации с запасом более чем в два раза . Кроме того, необходимо на входе оцифровщика применять фильтры , отсекающие нежелательные частоты выше определенного значения.

Именно поэтому используемые в звукозаписи «стандартные» частоты дискретизации выше 40 кГц – 44.1 и 48 кГц: такое семплирование обеспечивает запас для устранения искажений.

В можно поочередно услышать «хорошую» и «плохую» запись пилообразной волны на частотах 440, 880 и 1760 Гц. В первом варианте были применены фильтры, а во втором отчетливо слышен алиасинг.

Сегодня уже никого не удивишь даже значениями 32 бита или 96–192 кГц. С каждым годом производители «улучшают» характеристики приборов. Но поскольку, как я уже говорил, для фильтрации более высоких частот требуются более качественные и дорогие фильтры, нередко получается, что конвертор, работающий в режиме 16/44.1, дает более качественный звук, чем конвертор 24/192. Шумы квантования, алиасинг и отсутствие хороших фильтров делают свое дело. И это мы еще опускаем возможные погрешности, связанные с повышенной нагрузкой на систему при работе с более высокими параметрами звука.

Если статья оказалась полезной, вы можете подписаться на обновления этого блога , чтобы бесплатно получать новые материалы на электронную почту. Или вступайте