Цветовая субдискретизация

Цветовая субдискретизация (англ. Chroma subsampling) — технология кодирования изображений, при которой показатели яркости сохраняются для каждого пикселя, а данные о цвете — для групп пикселей, так частота выборки цветоразностных сигналов может быть меньше частоты выборки яркостного сигнала. Основана на особенности человеческого зрения, выраженной большей чувствительностью к перепадам яркости, чем цвета. Цветовая субдискретизация является важным способом снижения размера цифрового потока видеоданных (цифровое сжатие видеоинформации). Используется в системах аналогового и цифрового телевидения, цифровой видеозаписи и алгоритмах сжатия изображений, таких как JPEG.

На практике кодирование изображений осуществляется уменьшением разрешения в цветоразностных каналах при сохранении разрешения в канале яркости.

Метод был впервые разработан в 1950-х Альдой Бедфордом для системы цветного телевидения компании RCA. Позже он получил своё развитие в стандарте NTSC. Впрочем, принцип разделения яркости и информации о цвете был придуман ещё раньше — в 1938 году Джорджесом Валенси.

Для совместимости с черно-белым телевизионным сигналом и для возможности уменьшения полосы частот, требуемой для передачи цветностной информации, в цветном телевидении используются специальные схемы суммирования трёх составляющих видеосигнала Y' — означает яркость, а R-Y' и B-Y' — так называемые цветоразностные сигналы. Для перевода компонентного видеосигнала в цифровую форму в соответствии с рекомендациями ITU-R 601 применяется кодирование по следующим формулам:

При передаче таких сигналов возможно восстановление исходных составляющих цветов: красной (R), синей (B) и зеленой (G), которые используются в большинстве систем отображения видеоинформации.

При Y', Cr, Cb представлении видеосигнала цветоразностные компоненты Cr, Cb передаются с пространственным разрешением, в два раза меньшим разрешения по яркостному сигналу, при этом частота дискретизации для яркостного сигнала Y' устанавливается равной 13,5 МГц, что в два раза больше, чем для цветоразностных сигналов Cr и Cb — 6,75 МГц. Для цифровых стандартов принято базовое значение частоты дискретизации, равное 3,375 МГц, таким образом, частоты дискретизации яркостного и двух цветоразностных сигналов будут находиться в соотношении 4:2:2.

Для сигналов ТВЧ, согласно части II Рекомендации ITU-R 709-3, установлены частоты дискретизации сигналов яркости 74,25 МГц и цветности 37,125 МГц.

Форматы субдискретизации

[править | править код]

Структура дискретизации сигнала обозначается как соотношение между тремя частями X:a: b (например, 4:2:2), описывающими число выборок яркостных и цветоразностных сигналов. Также иногда используется обозначение с четырьмя частями (4:2:2:4), где четвёртая цифра, если она включена, должна быть идентична первой цифре, указывающая на наличие сигнала четвертого канала, содержащего информацию прозрачности (альфа-канал). Этими частями являются:

  • X — частота дискретизации яркостного канала, выраженная коэффициентом базовой частоты (ширина макропикселя)
  • a — число выборок цветоразностных сигналов (Cr, Cb) в горизонтальном направлении в первой строке
  • b — число (дополнительных) выборок цветоразностных сигналов (Cr, Cb) во второй строке
  • Alpha — частота дискретизации альфа-канала (по отношению к первой цифре). Может быть опущен, если альфа-компонент отсутствует, и равна X при его наличии.
4:1:1       4:2:0       4:2:2       4:4:4
Y'CrCb                                
                               
= = = =
Y'                                                                
                               
+ + + +
1 2 3 4  X = 4 1 2 3 4  X = 4 1 2 3 4  X = 4 1 2 3 4  X = 4
(Cr, Cb) 1  a = 1 1 2  a = 2 1 2  a = 2 1 2 3 4  a = 4
1  b = 1      b = 0 1 2  b = 2 1 2 3 4  b = 4
¼ горизонтального разрешения,
полное вертикальное разрешение
½ горизонтального разрешения,
½ вертикального разрешения
½ горизонтального разрешения,
полное вертикальное разрешение
полное горизонтальное разрешение,
полное вертикальное разрешение

Каждая из трех компонент Y'CbCr имеет одинаковую частоту дискретизации. Эта схема иногда используется в дорогих сканерах и кинематографическом постпродакшн производстве. Как правило, для предоставления такой пропускной способности используется двухканальный интерфейс HD-SDI стандарта SMPTE 372M. Первое подключение — для передачи сигнала 4:2:2, второе подключение — для сигнала 0:2:2, в сочетании будет передано 4:4:4.

Стоит отметить, что под «4:4:4» может пониматься цветовое пространство R'G'B', которое вовсе не имеет цветовой субдискретизации. Видеоформаты, такие как HDCAM SR, могут записывать цифровой видеосигнал с частотой выборки 4:4:4 R'G'B' посредством двухканального HD-SDI.

Используется в научных исследованиях, профессиональных системах и формате MPEG-2. Рекомендация 601 определяет стандарт полного цифрового видеосигнала с соотношением частот дискретизации яркостного и цветоразностных сигналов как 4:2:2. В каждой строке передается полный сигнал яркости, а для цветоразностных сигналов производится выборка каждого второго отсчета. Таким образом, цветовое горизонтальное разрешение снижается вдвое.

Этот режим также определен технически. Используется в ограниченном наборе аппаратных и программных кодеров.

В соотношении 4:1:1 горизонтальное разрешение цветоразностных сигналов снижается до четверти от полного разрешения сигнала яркости, также полоса пропускания сужается (пропускная способность увеличивается) в два раза по сравнению с режимом без субдискретизации. Первоначально 4:1:1 применялся в формате DV, который не считался вещательным и был единственным приемлемым форматом видеозаписи для низкобюджетных и потребительских приложений. В настоящее время DV-формат (с выборкой 4:1:1) используется профессионально для производства новостей и воспроизведения видео при помощи серверов.

В системе NTSC, если частота дискретизации яркости равна 13,5 МГц, то это означает, что каждый из сигналов Cr и Cb будет дискретизован с частотой 3,375 МГц, что соответствует максимальной пропускной способности частоты Найквиста 1,6875 МГц, в то время как традиционный «NTSC кодер высокого класса аналогового вещания» будет иметь частоту Найквиста 1,5 МГц и 0,5 МГц для I/Q каналов. Однако в большинстве единиц оборудования, особенно в дешевых телевизорах и VHS-/Betamax-видеомагнитофонах, каналы цветности имеют пропускную способность только 0,5 МГц для Cr и Cb (что эквивалентно для I/Q). Таким образом, система фактически обеспечивает увеличенную пропускную способность цвета по сравнению с лучшими композитными аналоговыми спецификациями для NTSC, несмотря на то, что используется только 1/4 от полной полосы частот цветовой составляющей «полного» цифрового сигнала. Форматы, которые используют 4:1:1, включают в себя:

  • DVCPRO (NTSC и PAL)
  • NTSC DV и DVCAM
  • D-7

Различные варианты 4:2:0 конфигураций можно найти в:

  • В стандартах кодирования видео ИСО/МЭК, MPEG, МСЭ-Т и Группы экспертов кодирования видео «H.26x», включая реализации H.262/MPEG-2 Part 2, такие как DVD (хотя некоторые профили MPEG-4 Part 2 и H.264/MPEG-4 AVC позволяют кодировать со структурой выборки более высокого качества, например, такой как 4:4:4)
  • PAL DV и DVCAM
  • HDV
  • AVCHD и AVC-Intra 50
  • Apple Intermediate Codec
  • Наиболее распространенные реализации JPEG / JFIF и MJPEG
  • VC-1

Для цветоразностных компонентов Cb и Cr при дискретизации отбрасывается каждый второй отсчёт по горизонтали и по вертикали. Есть три варианта схем 4:2:0, имеющих различные горизонтальные и вертикальные размещения отсчётов:

  • Отсчеты цветоразностных компонентов в формате 4:2:0, принятом в системе компрессии MPEG-2, не совмещены с отсчётами яркостной составляющей.
  • В JPEG / JFIF, H.261 и MPEG-1, Cb и Cr совмещены и располагаются между альтернативными отсчетами яркости.
  • В 4:2:0 DV, отсчёты цветоразностных компонентов Cb и Cr совмещены с отсчётами яркостной составляющей изображения, может быть получен из прототипной структуры 4:2:2 путём поочередного исключения одного цветоразностного компонента в каждой второй строке каждого поля.

Этот вид обработки данных особенно хорошо подходит для цветных систем PAL и SECAM. Большинство цифровых видео форматов PAL используют соответственно 4:2:0, за исключением DVCPRO25, который использует 4:1:1. Оба варианта 4:1:1 и 4:2:0 вдвое снижают требования к пропускной способности по сравнению с представлением без субдискретизации.

Поддерживается некоторыми кодеками, но используется не слишком широко. При этом соотношении коэффициентов используется половина вертикального и четверть горизонтального цветового разрешения, и лишь одна восьмая часть от полосы пропускания максимального цветового разрешения.

Используется в формате видеозаписи высокой чёткости Sony HDCAM (не HDCAM SR). В горизонтальном направлении производится выборка отсчетов сигнала яркости на три четверти от полной частоты дискретизации HD — 1440 выборок в строке против 1920 в HDCAM SR. В вертикальном направлении, как в канале яркости, так и в канале цветности, производится полная дискретизация HD (1080 отсчетов).

Терминология

[править | править код]

Термин Y'UV относится к аналоговой схеме кодирования, в то время как Y'CbCr ссылается на цифровые схемы кодирования. Одно из различий между ними в том, что набор коэффициентов компонентов цветности U, V и Cb, Cr различен. Однако термин YUV часто используется ошибочно при обращении к кодировке Y'CbCr. Следовательно, выражения типа «4:2:2 YUV» всегда относятся к «4:2:2 Y'CbCr», так как просто нет такого понятия, как 4:x:x в аналоговой кодировке, например, YUV.

Также термином яркость и символом Y часто пользуются ошибочно, обращаясь к яркости, которая обозначается символом Y'. Обратите внимание, что яркость (Y'), принятая у видео-инженеров, отклоняется от яркости (Y) в колориметрии (как определено в CIE). Яркость (в ТВ) формируется как взвешенная сумма компонентов RGB с гамма-коррекцией (трехцветной). Яркость формируется как взвешенная сумма линейных (трехцветной) компонентов RGB.

На практике CIE символ Y часто неправильно используется для обозначения яркости. В 1993 году SMPTE принятое Руководство для инженеров EG 28 уточняет два термина. Обратите внимание, что символ ' (штрих) используется, чтобы указать гамма-коррекцию.

Кроме того, понятие хрома/цветность у видеоинженеров отличается от цветности в колориметрии. Хрома/цветность в видеоинженерной практике формируется из весовых трехцветных нелинейных компонентов. Термины «цветность» и «насыщенность» часто используются как синонимы для обозначения цветности.

Видеоформаты

[править | править код]

Следующая таблица показывает характеристики большинства видеоформатов и типов применяемой субдискретизации цветоразностных компонент, а также другие связанные с ними параметры, такие как скорость передачи данных и степень сжатия.

Формат Разработчик Субдискретизация Глубина цвета Скорость потока данных, Мбит/с Тип компрессии Степень сжатия Разрешение, пикс.
Телевидение стандартной чёткости (SD)
DV/MiniDV Sony, Panasonic, Philips, Hitachi и JVC 4:2:0 (PAL)
4:1:1 (NTSC)
8 бит 25 ДКП 5:1 720×576 (PAL)
720×480 (NTSC)
DVCPRO 25 Panasonic 4:1:1 8 бит 25 ДКП 5:1 720×576 (PAL)
720×480 (NTSC)
DVCPRO 50 Panasonic 4:2:2 8 бит 50 ДКП 3,3:1 720×576 (PAL)
720×480 (NTSC)
DVCAM Sony 4:2:0 (PAL)
4:1:1 (NTSC)
8 бит 25 ДКП 5:1 720×576 (PAL)
720×480 (NTSC)
Digital Betacam Sony 4:2:2 10 бит 90 ДКП 2,3:1 720×576 (PAL)
720×480 (NTSC)
Betacam SX Sony 4:2:2 10 бит 18/170 MPEG-2 10:1 720×576 (PAL)
720×480 (NTSC)
MPEG IMX Sony 4:2:2 8 бит 30
40
50
MPEG-2 6:1
4:1
3,3:1
720×576 (PAL)
720×480 (NTSC)
XDCAM Sony 4:2:0/4:1:1
4:2:2
8 бит 30
40
50
ДКП
MPEG-2
6:1
4:1
3,3:1
720×576 (PAL)
720×480 (NTSC)
Телевидение высокой чёткости (HD)
DVCPRO 100 Panasonic 4:2:2 8 бит 100 ДКП 6,7:1 1440×1080
960×720
HDCAM Sony 3:1:1 8 бит 144 MPEG-4 4:1 1440×1080
HDCAM SR Sony 4:2:2
4:4:4
10 бит 440
880
MPEG-4 4,2:1
2,7:1
1920×1080
HDV Sony, JVC, Canon 4:2:0 8 бит 19/25 MPEG-2 18:1 1440×1080
1920×1080
1280×720
AVCHD Panasonic, Sony 4:2:0 8 бит 18/24 H.264/MPEG-4 1440×1080
1920×1080
1280×720
XDCAM HD Sony 4:2:0 8 бит 18/50 MPEG-2 1440×1080
1280×720

Литература

[править | править код]