Цветовая субдискретизация
Цветовая субдискретизация (англ. Chroma subsampling) — технология кодирования изображений, при которой показатели яркости сохраняются для каждого пикселя, а данные о цвете — для групп пикселей, так частота выборки цветоразностных сигналов может быть меньше частоты выборки яркостного сигнала. Основана на особенности человеческого зрения, выраженной большей чувствительностью к перепадам яркости, чем цвета. Цветовая субдискретизация является важным способом снижения размера цифрового потока видеоданных (цифровое сжатие видеоинформации). Используется в системах аналогового и цифрового телевидения, цифровой видеозаписи и алгоритмах сжатия изображений, таких как JPEG.
На практике кодирование изображений осуществляется уменьшением разрешения в цветоразностных каналах при сохранении разрешения в канале яркости.
История
[править | править код]Метод был впервые разработан в 1950-х Альдой Бедфордом для системы цветного телевидения компании RCA. Позже он получил своё развитие в стандарте NTSC. Впрочем, принцип разделения яркости и информации о цвете был придуман ещё раньше — в 1938 году Джорджесом Валенси.
Введение
[править | править код]Для совместимости с черно-белым телевизионным сигналом и для возможности уменьшения полосы частот, требуемой для передачи цветностной информации, в цветном телевидении используются специальные схемы суммирования трёх составляющих видеосигнала Y' — означает яркость, а R-Y' и B-Y' — так называемые цветоразностные сигналы. Для перевода компонентного видеосигнала в цифровую форму в соответствии с рекомендациями ITU-R 601 применяется кодирование по следующим формулам:
При передаче таких сигналов возможно восстановление исходных составляющих цветов: красной (R), синей (B) и зеленой (G), которые используются в большинстве систем отображения видеоинформации.
При Y', Cr, Cb представлении видеосигнала цветоразностные компоненты Cr, Cb передаются с пространственным разрешением, в два раза меньшим разрешения по яркостному сигналу, при этом частота дискретизации для яркостного сигнала Y' устанавливается равной 13,5 МГц, что в два раза больше, чем для цветоразностных сигналов Cr и Cb — 6,75 МГц. Для цифровых стандартов принято базовое значение частоты дискретизации, равное 3,375 МГц, таким образом, частоты дискретизации яркостного и двух цветоразностных сигналов будут находиться в соотношении 4:2:2.
Для сигналов ТВЧ, согласно части II Рекомендации ITU-R 709-3, установлены частоты дискретизации сигналов яркости 74,25 МГц и цветности 37,125 МГц.
Форматы субдискретизации
[править | править код]Структура дискретизации сигнала обозначается как соотношение между тремя частями X:a: b (например, 4:2:2), описывающими число выборок яркостных и цветоразностных сигналов. Также иногда используется обозначение с четырьмя частями (4:2:2:4), где четвёртая цифра, если она включена, должна быть идентична первой цифре, указывающая на наличие сигнала четвертого канала, содержащего информацию прозрачности (альфа-канал). Этими частями являются:
- X — частота дискретизации яркостного канала, выраженная коэффициентом базовой частоты (ширина макропикселя)
- a — число выборок цветоразностных сигналов (Cr, Cb) в горизонтальном направлении в первой строке
- b — число (дополнительных) выборок цветоразностных сигналов (Cr, Cb) во второй строке
- Alpha — частота дискретизации альфа-канала (по отношению к первой цифре). Может быть опущен, если альфа-компонент отсутствует, и равна X при его наличии.
4:1:1 | 4:2:0 | 4:2:2 | 4:4:4 | ||||||||||||||||||||
Y'CrCb | |||||||||||||||||||||||
= | = | = | = | ||||||||||||||||||||
Y' | |||||||||||||||||||||||
+ | + | + | + | ||||||||||||||||||||
1 | 2 | 3 | 4 | X = 4 | 1 | 2 | 3 | 4 | X = 4 | 1 | 2 | 3 | 4 | X = 4 | 1 | 2 | 3 | 4 | X = 4 | ||||
(Cr, Cb) | 1 | a = 1 | 1 | 2 | a = 2 | 1 | 2 | a = 2 | 1 | 2 | 3 | 4 | a = 4 | ||||||||||
1 | b = 1 | b = 0 | 1 | 2 | b = 2 | 1 | 2 | 3 | 4 | b = 4 | |||||||||||||
¼ горизонтального разрешения, полное вертикальное разрешение | ½ горизонтального разрешения, ½ вертикального разрешения | ½ горизонтального разрешения, полное вертикальное разрешение | полное горизонтальное разрешение, полное вертикальное разрешение |
4:4:4
[править | править код]Каждая из трех компонент Y'CbCr имеет одинаковую частоту дискретизации. Эта схема иногда используется в дорогих сканерах и кинематографическом постпродакшн производстве. Как правило, для предоставления такой пропускной способности используется двухканальный интерфейс HD-SDI стандарта SMPTE 372M. Первое подключение — для передачи сигнала 4:2:2, второе подключение — для сигнала 0:2:2, в сочетании будет передано 4:4:4.
Стоит отметить, что под «4:4:4» может пониматься цветовое пространство R'G'B', которое вовсе не имеет цветовой субдискретизации. Видеоформаты, такие как HDCAM SR, могут записывать цифровой видеосигнал с частотой выборки 4:4:4 R'G'B' посредством двухканального HD-SDI.
4:2:2
[править | править код]Используется в научных исследованиях, профессиональных системах и формате MPEG-2. Рекомендация 601 определяет стандарт полного цифрового видеосигнала с соотношением частот дискретизации яркостного и цветоразностных сигналов как 4:2:2. В каждой строке передается полный сигнал яркости, а для цветоразностных сигналов производится выборка каждого второго отсчета. Таким образом, цветовое горизонтальное разрешение снижается вдвое.
4:2:1
[править | править код]Этот режим также определен технически. Используется в ограниченном наборе аппаратных и программных кодеров.
4:1:1
[править | править код]В соотношении 4:1:1 горизонтальное разрешение цветоразностных сигналов снижается до четверти от полного разрешения сигнала яркости, также полоса пропускания сужается (пропускная способность увеличивается) в два раза по сравнению с режимом без субдискретизации. Первоначально 4:1:1 применялся в формате DV, который не считался вещательным и был единственным приемлемым форматом видеозаписи для низкобюджетных и потребительских приложений. В настоящее время DV-формат (с выборкой 4:1:1) используется профессионально для производства новостей и воспроизведения видео при помощи серверов.
В системе NTSC, если частота дискретизации яркости равна 13,5 МГц, то это означает, что каждый из сигналов Cr и Cb будет дискретизован с частотой 3,375 МГц, что соответствует максимальной пропускной способности частоты Найквиста 1,6875 МГц, в то время как традиционный «NTSC кодер высокого класса аналогового вещания» будет иметь частоту Найквиста 1,5 МГц и 0,5 МГц для I/Q каналов. Однако в большинстве единиц оборудования, особенно в дешевых телевизорах и VHS-/Betamax-видеомагнитофонах, каналы цветности имеют пропускную способность только 0,5 МГц для Cr и Cb (что эквивалентно для I/Q). Таким образом, система фактически обеспечивает увеличенную пропускную способность цвета по сравнению с лучшими композитными аналоговыми спецификациями для NTSC, несмотря на то, что используется только 1/4 от полной полосы частот цветовой составляющей «полного» цифрового сигнала. Форматы, которые используют 4:1:1, включают в себя:
- DVCPRO (NTSC и PAL)
- NTSC DV и DVCAM
- D-7
4:2:0
[править | править код]Различные варианты 4:2:0 конфигураций можно найти в:
- В стандартах кодирования видео ИСО/МЭК, MPEG, МСЭ-Т и Группы экспертов кодирования видео «H.26x», включая реализации H.262/MPEG-2 Part 2, такие как DVD (хотя некоторые профили MPEG-4 Part 2 и H.264/MPEG-4 AVC позволяют кодировать со структурой выборки более высокого качества, например, такой как 4:4:4)
- PAL DV и DVCAM
- HDV
- AVCHD и AVC-Intra 50
- Apple Intermediate Codec
- Наиболее распространенные реализации JPEG / JFIF и MJPEG
- VC-1
Для цветоразностных компонентов Cb и Cr при дискретизации отбрасывается каждый второй отсчёт по горизонтали и по вертикали. Есть три варианта схем 4:2:0, имеющих различные горизонтальные и вертикальные размещения отсчётов:
- Отсчеты цветоразностных компонентов в формате 4:2:0, принятом в системе компрессии MPEG-2, не совмещены с отсчётами яркостной составляющей.
- В JPEG / JFIF, H.261 и MPEG-1, Cb и Cr совмещены и располагаются между альтернативными отсчетами яркости.
- В 4:2:0 DV, отсчёты цветоразностных компонентов Cb и Cr совмещены с отсчётами яркостной составляющей изображения, может быть получен из прототипной структуры 4:2:2 путём поочередного исключения одного цветоразностного компонента в каждой второй строке каждого поля.
Этот вид обработки данных особенно хорошо подходит для цветных систем PAL и SECAM. Большинство цифровых видео форматов PAL используют соответственно 4:2:0, за исключением DVCPRO25, который использует 4:1:1. Оба варианта 4:1:1 и 4:2:0 вдвое снижают требования к пропускной способности по сравнению с представлением без субдискретизации.
4:1:0
[править | править код]Поддерживается некоторыми кодеками, но используется не слишком широко. При этом соотношении коэффициентов используется половина вертикального и четверть горизонтального цветового разрешения, и лишь одна восьмая часть от полосы пропускания максимального цветового разрешения.
3:1:1
[править | править код]Используется в формате видеозаписи высокой чёткости Sony HDCAM (не HDCAM SR). В горизонтальном направлении производится выборка отсчетов сигнала яркости на три четверти от полной частоты дискретизации HD — 1440 выборок в строке против 1920 в HDCAM SR. В вертикальном направлении, как в канале яркости, так и в канале цветности, производится полная дискретизация HD (1080 отсчетов).
Терминология
[править | править код]Термин Y'UV относится к аналоговой схеме кодирования, в то время как Y'CbCr ссылается на цифровые схемы кодирования. Одно из различий между ними в том, что набор коэффициентов компонентов цветности U, V и Cb, Cr различен. Однако термин YUV часто используется ошибочно при обращении к кодировке Y'CbCr. Следовательно, выражения типа «4:2:2 YUV» всегда относятся к «4:2:2 Y'CbCr», так как просто нет такого понятия, как 4:x:x в аналоговой кодировке, например, YUV.
Также термином яркость и символом Y часто пользуются ошибочно, обращаясь к яркости, которая обозначается символом Y'. Обратите внимание, что яркость (Y'), принятая у видео-инженеров, отклоняется от яркости (Y) в колориметрии (как определено в CIE). Яркость (в ТВ) формируется как взвешенная сумма компонентов RGB с гамма-коррекцией (трехцветной). Яркость формируется как взвешенная сумма линейных (трехцветной) компонентов RGB.
На практике CIE символ Y часто неправильно используется для обозначения яркости. В 1993 году SMPTE принятое Руководство для инженеров EG 28 уточняет два термина. Обратите внимание, что символ ' (штрих) используется, чтобы указать гамма-коррекцию.
Кроме того, понятие хрома/цветность у видеоинженеров отличается от цветности в колориметрии. Хрома/цветность в видеоинженерной практике формируется из весовых трехцветных нелинейных компонентов. Термины «цветность» и «насыщенность» часто используются как синонимы для обозначения цветности.
Видеоформаты
[править | править код]Следующая таблица показывает характеристики большинства видеоформатов и типов применяемой субдискретизации цветоразностных компонент, а также другие связанные с ними параметры, такие как скорость передачи данных и степень сжатия.
Формат | Разработчик | Субдискретизация | Глубина цвета | Скорость потока данных, Мбит/с | Тип компрессии | Степень сжатия | Разрешение, пикс. |
---|---|---|---|---|---|---|---|
Телевидение стандартной чёткости (SD) | |||||||
DV/MiniDV | Sony, Panasonic, Philips, Hitachi и JVC | 4:2:0 (PAL) 4:1:1 (NTSC) | 8 бит | 25 | ДКП | 5:1 | 720×576 (PAL) 720×480 (NTSC) |
DVCPRO 25 | Panasonic | 4:1:1 | 8 бит | 25 | ДКП | 5:1 | 720×576 (PAL) 720×480 (NTSC) |
DVCPRO 50 | Panasonic | 4:2:2 | 8 бит | 50 | ДКП | 3,3:1 | 720×576 (PAL) 720×480 (NTSC) |
DVCAM | Sony | 4:2:0 (PAL) 4:1:1 (NTSC) | 8 бит | 25 | ДКП | 5:1 | 720×576 (PAL) 720×480 (NTSC) |
Digital Betacam | Sony | 4:2:2 | 10 бит | 90 | ДКП | 2,3:1 | 720×576 (PAL) 720×480 (NTSC) |
Betacam SX | Sony | 4:2:2 | 10 бит | 18/170 | MPEG-2 | 10:1 | 720×576 (PAL) 720×480 (NTSC) |
MPEG IMX | Sony | 4:2:2 | 8 бит | 30 40 50 | MPEG-2 | 6:1 4:1 3,3:1 | 720×576 (PAL) 720×480 (NTSC) |
XDCAM | Sony | 4:2:0/4:1:1 4:2:2 | 8 бит | 30 40 50 | ДКП MPEG-2 | 6:1 4:1 3,3:1 | 720×576 (PAL) 720×480 (NTSC) |
Телевидение высокой чёткости (HD) | |||||||
DVCPRO 100 | Panasonic | 4:2:2 | 8 бит | 100 | ДКП | 6,7:1 | 1440×1080 960×720 |
HDCAM | Sony | 3:1:1 | 8 бит | 144 | MPEG-4 | 4:1 | 1440×1080 |
HDCAM SR | Sony | 4:2:2 4:4:4 | 10 бит | 440 880 | MPEG-4 | 4,2:1 2,7:1 | 1920×1080 |
HDV | Sony, JVC, Canon | 4:2:0 | 8 бит | 19/25 | MPEG-2 | 18:1 | 1440×1080 1920×1080 1280×720 |
AVCHD | Panasonic, Sony | 4:2:0 | 8 бит | 18/24 | H.264/MPEG-4 | 1440×1080 1920×1080 1280×720 | |
XDCAM HD | Sony | 4:2:0 | 8 бит | 18/50 | MPEG-2 | 1440×1080 1280×720 |
См. также
[править | править код]- Цветовое пространство (Color space)
- SMPTE — Общество инженеров кино и телевидения (Society of Motion Picture and Television Engineers)
- Цифровое видео (Digital video)
- HDTV
- YCbCr
- YPbPr
- CCIR 601 4:2:2 SDTV
- YUV
Литература
[править | править код]- Константин Гласман. Цифровая магнитная видеозапись. Формат DV // "625" : журнал. — 2002. — № 03. Архивировано 5 марта 2012 года.
- Андрей Ряхин. Персональные компьютеры и телевидение // "625" : журнал. — 1996. — № 02. Архивировано 5 марта 2012 года.
- Олег Татарников. Видеокарты с функцией оцифровки аналогового видеосигнала // КомпьютерПресс : журнал. — 1999. — № 07.
- Олег Татарников. Методы сжатия цифрового видео // КомпьютерПресс : журнал. — 2004. — № 08.
- (англ.) Poynton, Charles. «YUV and luminance considered harmful: A plea for precise terminology in video» [1]
- (англ.) Poynton, Charles. «Digital Video and HDTV: Algorithms and Interfaces.» USA: Morgan Kaufmann Publishers, 2003.
- (англ.) Kerr, Douglas A. «Chrominance Subsampling in Digital Images» [2]