Chroma Subsampling
Chroma Subsampling
Chroma subsampling is the practice of encoding images by implementing less resolution for
chroma information than for luma information, taking advantage of the human visual
system's lower acuity for color differences than for luminance.[1]
It is used in many video encoding schemes both analog and digital and also in JPEG
encoding.
Rationale
In full size, this image shows the difference between four subsampling schemes. Note how
similar the color images appear. The lower row shows the resolution of the color information.
Digital signals are often compressed to save transmission time and reduce file size. Since the
human visual system is much more sensitive to variations in brightness than color, a video
system can be optimized by devoting more bandwidth to the luma component (usually
denoted Y'), than to the color difference components Cb and Cr. In compressed images, for
example, the 4:2:2 Y'CbCr scheme requires two-thirds the bandwidth of (4:4:4) R'G'B'. This
reduction results in almost no visual difference as perceived by the viewer for photographs,
although images produced digitally containing harsh lines and saturated colors will have
significant artifacts.[citation needed]
| III-1
engineering approximation being used. Indeed, similar bleeding can occur also with gamma =
1, whence the reversing of the order of operations between gamma correction and forming
the weighted sum can make no difference. The chroma can influence the luma specifically at
the pixels where the subsampling put no chroma. Interpolation may then put chroma values
there which are incompatible with the luma value there, and further post-processing of that
Y'CbCr into R'G'B' for that pixel is what ultimately produces false luminance upon display.
Image after color subsampling (compressed with Sony Vegas DV codec, box filtering
applied.)
b: number of changes of chrominance samples (Cr, Cb) between first and second row
of J pixels.
Alpha: horizontal factor (relative to first digit). May be omitted if alpha component is
not present, and is equal to J when present.
This notation is not valid for all combinations and has exceptions, e.g. 4:1:0 (where the height
of the region is not 2 pixels but 4 pixels, so if 8 bits/component are used the media would be
9 bits/pixel) and 4:2:1.
III-2 |
Pesantren Muadalah
4:1:1
4:2:0
4:2:2
4:4:4
4:4:0
Y'CrCb
Y'
(Cr,
Cb)
1 2 3 4 J=4
1 2 3 4 a=4
b=0
full horizontal
resolution,
vertical
resolution
The mapping examples given are only theoretical and for illustration. Also note that the
diagram does not indicate any chroma filtering, which should be applied to avoid aliasing.
To calculate required bandwidth factor relative to 4:4:4 (or 4:4:4:4), one needs to sum all the
factors and divide the result by 12 (or 16, if alpha is present).
Types of subsampling
4:4:4
Each of the three Y'CbCr components have the same sample rate, thus there is no chroma
subsampling. This scheme is sometimes used in high-end film scanners and cinematic post
production.
Note that "4:4:4" may instead be referring to R'G'B' color space, which implicitly does also
not have any chroma subsampling. Formats such as HDCAM SR can record 4:4:4 R'G'B'
over dual-link HD-SDI.
4:2:2
The two chroma components are sampled at half the sample rate of luma: the horizontal
chroma resolution is halved. This reduces the bandwidth of an uncompressed video signal by
one-third with little to no visual difference.[citation needed]
Many high-end digital video formats and interfaces use this scheme:
AVC-Intra 100
Digital Betacam
| III-3
Digital-S
XDCAM HD422
4:2:1
This sampling mode is not expressible in J:a:b notation. '4:2:1' is an obsolete term from a
previous notational scheme, and very few software or hardware codecs use it. Cb horizontal
resolution is half that of Cr (and a quarter of the horizontal resolution of Y). This exploits the
fact that human eye has less spatial sensitivity to blue/yellow than to red/green. NTSC is
similar, in using lower resolution for blue/yellow than red/green, which in turn has less
resolution than luma.
4:1:1
In 4:1:1 chroma subsampling, the horizontal color resolution is quartered, and the bandwidth
is halved compared to no chroma subsampling. Initially, 4:1:1 chroma subsampling of the DV
format was not considered to be broadcast quality and was only acceptable for low-end and
consumer applications.[3][4] Currently, DV-based formats (some of which use 4:1:1 chroma
subsampling) are used professionally in electronic news gathering and in playout servers. DV
has also been sporadically used in feature films and in digital cinematography.
In the NTSC system, if the luma is sampled at 13.5 MHz, then this means that the Cr and Cb
signals will each be sampled at 3.375 MHz, which corresponds to a maximum Nyquist
bandwidth of 1.6875 MHz, whereas traditional "high-end broadcast analog NTSC encoder"
would have a Nyquist bandwidth of 1.5 MHz and 0.5 MHz for the I/Q channels. However, in
most equipment, especially cheap TV sets and VHS/Betamax VCR's the chroma channels
have only the 0.5 MHz bandwidth for both Cr and Cb (or equivalently for I/Q). Thus the DV
system actually provides a superior color bandwidth compared to the best composite analog
specifications for NTSC, despite having only 1/4 of the chroma bandwidth of a "full" digital
signal.
Formats that use 4:1:1 chroma subsampling include:
D-7
4:2:0
In 4:2:0, the horizontal sampling is doubled compared to 4:1:1, but as the Cb and Cr
channels are only sampled on each alternate line in this scheme, the vertical resolution is
halved. The data rate is thus the same. This fits reasonably well with the PAL color encoding
III-4 |
Pesantren Muadalah
system since this has only half the vertical chrominance resolution of NTSC. It would also fit
extremely well with the SECAM color encoding system since like that format, 4:2:0 only
stores and transmits one color channel per line (the other channel being recovered from the
previous line). However, little equipment has actually been produced that outputs a SECAM
analogue video signal. In general SECAM territories either have to use a PAL capable display
or a transcoder to convert the PAL signal to SECAM for display.
Different variants of 4:2:0 chroma configurations are found in:
All ISO/IEC MPEG and ITU-T VCEG H.26x video coding standards including
H.262/MPEG-2 Part 2 implementations (although some profiles of MPEG-4 Part 2
and H.264/MPEG-4 AVC allow higher-quality sampling schemes such as 4:4:4)
DVD-Video and Blu-ray Disc.[5][6]
HDV
VC-1
SuperMHL [7]
In MPEG-2, Cb and Cr are cosited horizontally. Cb and Cr are sited between pixels in
the vertical direction (sited interstitially).
In JPEG/JFIF, H.261, and MPEG-1, Cb and Cr are sited interstitially, halfway
between alternate luma samples.
In 4:2:0 DV, Cb and Cr are co-sited in the horizontal direction. In the vertical
direction, they are co-sited on alternating lines.
Most digital video formats corresponding to PAL use 4:2:0 chroma subsampling, with the
exception of DVCPRO25, which uses 4:1:1 chroma subsampling. Both the 4:1:1 and 4:2:0
schemes halve the bandwidth compared to no chroma subsampling.
With interlaced material, 4:2:0 chroma subsampling can result in motion artifacts if it is
implemented the same way as for progressive material. The luma samples are derived from
separate time intervals while the chroma samples would be derived from both time intervals.
It is this difference that can result in motion artifacts. The MPEG-2 standard allows for an
alternate interlaced sampling scheme where 4:2:0 is applied to each field (not both fields at
once). This solves the problem of motion artifacts, reduces the vertical chroma resolution by
half, and can introduce comb-like artifacts in the image.
Bagian III : Pedoman Penyelenggaraan Pondok Pesantren Muadalah
| III-5
Original. *This image shows a single field. The moving text has some motion blur applied to
it.
4:2:0 progressive sampling applied to moving interlaced material. Note that the chroma
leads and trails the moving text. *This image shows a single field.
4:2:0 interlaced sampling applied to moving interlaced material. *This image shows a single
field.
In the 4:2:0 interlaced scheme however, vertical resolution of the chroma is roughly halved
since the chroma samples effectively describe an area 2 samples wide by 4 samples tall
instead of 2X2. As well, the spatial displacement between both fields can result in the
appearance of comb-like chroma artifacts.
4:2:0 progressive sampling applied to a still image. Both fields are shown.
4:2:0 interlaced sampling applied to a still image. Both fields are shown.
If the interlaced material is to be de-interlaced, the comb-like chroma artifacts (from 4:2:0
interlaced sampling) can be removed by blurring the chroma vertically.[9]
4:1:0
III-6 |
Pesantren Muadalah
This ratio is possible, and some codecs support it, but it is not widely used. This ratio uses
half of the vertical and one-fourth the horizontal color resolutions, with only one-eighth of
the bandwidth of the maximum color resolutions used. Uncompressed video in this format
with 8-bit quantization uses 10 bytes for every macropixel (which is 4 x 2 pixels). It has the
equivalent chrominance bandwidth of a PAL I signal decoded with a delay line decoder, and
still very much superior to NTSC.
3:1:1
Used by Sony in their HDCAM High Definition recorders (not HDCAM SR). In the
horizontal dimension, luma is sampled horizontally at three quarters of the full HD sampling
rate- 1440 samples per row instead of 1920. Chroma is sampled at 480 samples per row, a
third of the luma sampling rate.
In the vertical dimension, both luma and chroma are sampled at the full HD sampling rate
(1080 samples vertically).
Out-of-gamut colors
One of the artifacts that can occur with chroma subsampling is that out-of-gamut colors can
occur upon chroma reconstruction. Suppose the image consisted of alternating 1-pixel red
and black lines and the subsampling omitted the chroma for the black pixels. Chroma from
the red pixels will be reconstructed onto the black pixels, causing the new pixels to have
positive red and negative green and blue values. As displays cannot output negative light
(negative light does not exist), these negative values will effectively be clipped and the
resulting luma value will be too high.[10] Similar artifacts arise in the less artificial example of
gradation near a fairly sharp red/black boundary.
Filtering during subsampling can also cause colors to go out of gamut.
Terminology
The term Y'UV refers to an analog encoding scheme while Y'CbCr refers to a digital
encoding scheme.[citation needed] One difference between the two is that the scale factors on the
chroma components (U, V, Cb, and Cr) are different. However, the term YUV is often used
erroneously to refer to Y'CbCr encoding. Hence, expressions like "4:2:2 YUV" always refer
to 4:2:2 Y'CbCr since there simply is no such thing as 4:x:x in analog encoding (such as
YUV).
In a similar vein, the term luminance and the symbol Y are often used erroneously to refer to
luma, which is denoted with the symbol Y'. Note that the luma (Y') of video engineering
deviates from the luminance (Y) of color science (as defined by CIE). Luma is formed as the
weighted sum of gamma-corrected (tristimulus) RGB components. Luminance is formed as a
weighed sum of linear (tristimulus) RGB components.
| III-7
In practice, the CIE symbol Y is often incorrectly used to denote luma. In 1993, SMPTE
adopted Engineering Guideline EG 28, clarifying the two terms. Note that the prime symbol '
is used to indicate gamma correction.
Similarly, the chroma/chrominance of video engineering differs from the chrominance of
color science. The chroma/chrominance of video engineering is formed from weighted
tristimulus components, not linear components. In video engineering practice, the terms
chroma, chrominance, and saturation are often used interchangeably to refer to chrominance.
Dalam ukuran penuh, gambar ini menunjukkan perbedaan antara empat skema
subsampling. Perhatikan seberapa mirip gambar berwarna muncul. Barisan
bawah menunjukkan resolusi informasi warna.
sinyal digital sering dikompresi untuk menghemat waktu transmisi dan
mengurangi ukuran file. Karena sistem visual manusia jauh lebih sensitif
terhadap variasi kecerahan dari warna, sistem video dapat dioptimalkan dengan
mengabdikan lebih banyak bandwidth untuk komponen luma (biasanya
dilambangkan Y '), dibandingkan dengan warna komponen perbedaan Cb dan Cr.
Dalam gambar dikompresi, misalnya, 4: 2: Skema 2 Y'CbCr membutuhkan duapertiga bandwidth (4: 4: 4) R'n'B '. Hasil pengurangan ini hampir tidak ada
perbedaan visual yang dirasakan oleh pemirsa untuk foto-foto, meskipun gambar
yang dihasilkan digital yang berisi garis keras dan warna jenuh akan memiliki
artefak yang signifikan. [rujukan?]
Cara kerja subsampling
Karena sistem visual manusia kurang sensitif terhadap posisi dan gerak warna
dari luminance, [2] bandwidth dapat dioptimalkan dengan menyimpan lebih
luminance detail dibandingkan warna rinci. Pada jarak pandang normal, tidak ada
kerugian jelas dikeluarkan dengan sampling warna detail pada tingkat yang lebih
rendah [jelas]. Dalam sistem video, ini dicapai melalui penggunaan komponen
perbedaan warna. sinyal dibagi menjadi luma (Y ') komponen dan dua komponen
perbedaan warna (chroma).
Dalam penglihatan manusia ada tiga saluran untuk deteksi warna, dan untuk
banyak sistem warna, tiga "saluran" sudah cukup untuk mewakili sebagian besar
warna. Sebagai contoh: merah, hijau, biru atau magenta, kuning, cyan. Tapi ada
cara lain untuk mewakili warna. Dalam banyak sistem video, tiga saluran
pencahayaan dan dua saluran chroma. Dalam video, luma dan chroma
komponen terbentuk sebagai jumlah tertimbang gamma-dikoreksi (tristimulus)
R'G'B 'komponen bukan linear (tristimulus) komponen RGB. Akibatnya, luma
harus dibedakan dari pencahayaan. Bahwa ada beberapa "pendarahan" dari
pencahayaan dan warna informasi antara luma dan chroma komponen dalam
video, kesalahan yang terbesar untuk warna sangat jenuh dan terlihat di antara
magenta dan hijau bar dari pola uji warna bar (yang telah kroma subsampling
diterapkan ), tidak boleh dikaitkan dengan pendekatan teknik ini digunakan.
III-8 |
Pesantren Muadalah
Memang, perdarahan yang sama dapat terjadi juga dengan gamma = 1, mana
yang membalikkan dari urutan operasi antara koreksi gamma dan membentuk
jumlah tertimbang dapat membuat perbedaan. chroma dapat mempengaruhi
luma yang khusus di pixel mana subsampling yang tidak menaruh kroma.
Interpolasi kemudian dapat menempatkan nilai-nilai chroma ada yang tidak
sesuai dengan nilai luma ada, dan pasca-pengolahan lebih lanjut dari Y'CbCr
yang menjadi R'G'B 'untuk pixel itulah yang akhirnya menghasilkan pencahayaan
palsu pada layar.
Asli tanpa subsampling warna. 200% zoom.
Gambar setelah warna subsampling (dikompresi dengan Sony Vegas DV codec,
kotak penyaringan diterapkan.)
Sampling sistem dan rasio
Skema subsampling biasanya dinyatakan sebagai rasio tiga bagian J: a: b
(misalnya 4: 2: 2) atau empat bagian jika alpha channel hadir (misalnya 4: 2: 2:
4), yang menggambarkan jumlah pencahayaan dan sampel chrominance di
wilayah konseptual yang J piksel lebar, dan tinggi 2 piksel. Bagian-bagian yang
(dalam rangka masing-masing):
J: horisontal sampel referensi (lebar daerah konseptual). Biasanya, 4.
a: jumlah sampel chrominance (Cr, Cb) pada baris pertama dari J piksel.
b: jumlah perubahan sampel chrominance (Cr, Cb) antara baris pertama dan
kedua J piksel.
Alpha: Faktor horizontal (relatif terhadap digit pertama). Dapat diabaikan jika
komponen alpha tidak hadir, dan sama dengan J saat ini.
notasi ini tidak berlaku untuk semua kombinasi dan memiliki pengecualian,
misalnya 4: 1: 0 (di mana ketinggian wilayah ini tidak 2 pixel tetapi 4 pixel, jadi
jika 8 bit / komponen yang digunakan media akan 9 bit / pixel) dan 4: 2: 1.
4: 1: 1 4: 2: 0 4: 2: 2 4: 4: 4 4: 4: 0
Y'CrCb = = = = =
Y '+ + + + + 1 2 3 4 J = 4 1 2 3 4 J = 4 1 2 3 4 J = 4 1 2 3 4 J = 4 1 2 3 4 J = 4
(Cr, Cb) 1 a = 1 1 2 a = 2 1 2 a = 2 1 2 3 4 a = 4 1 2 3 4 a = 4 1 b = 1 b = 0 1 2
b = 2 1 2 3 4 b = 4 b = 0 resolusi horizontal,
Resolusi vertikal penuh resolusi horizontal,
resolusi vertikal resolusi horizontal,
penuh resolusi vertikal penuh resolusi horizontal,
penuh resolusi vertikal penuh resolusi horizontal,
resolusi vertikal
Contoh pemetaan diberikan hanya teoritis dan untuk ilustrasi. Juga mencatat
bahwa diagram tidak menunjukkan adanya penyaringan kroma, yang harus
diterapkan untuk menghindari aliasing.
Untuk menghitung faktor bandwidth yang dibutuhkan relatif terhadap 4: 4: 4
(atau 4: 4: 4: 4), salah satu kebutuhan untuk jumlah semua faktor dan membagi
hasilnya dengan 12 (atau 16, jika alpha hadir).
Jenis subsampling
4: 4: 4
Masing-masing dari tiga komponen Y'CbCr memiliki sample rate yang sama,
sehingga tidak ada kroma subsampling. Skema ini kadang-kadang digunakan
dalam high-end Film scanner dan pasca produksi sinematik.
Bagian III : Pedoman Penyelenggaraan Pondok Pesantren Muadalah
| III-9
Perhatikan bahwa "4: 4: 4" mungkin yang dapat mengacu R'G'B 'ruang warna,
yang secara implisit tidak juga tidak memiliki kroma subsampling. Format seperti
HDCAM SR dapat merekam 4: 4: 4 R'G'B 'lebih dual-link HD-SDI.
4: 2: 2
Dua komponen chroma adalah sampel pada setengah tingkat sampel luma:
resolusi kroma horizontal dibelah dua. Hal ini mengurangi bandwidth dari sinyal
video terkompresi oleh sepertiga dengan sedikit atau tidak ada perbedaan
visual. [Rujukan?]
Banyak high-end format video digital dan interface menggunakan skema ini:
AVC-Intra 100
Betacam Digital
DVCPRO50 dan DVCPRO HD
Digital-S
CCIR 601 / Serial Digital Interface / D1
ProRes (HQ, 422, LT, dan Proxy)
XDCAM HD422
Canon MXF HD422
4: 2: 1
modus pengambilan sampel ini tidak dinyatakan dalam J: a: b notasi. '4: 2: 1'
adalah istilah usang dari skema notasi sebelumnya, dan sangat sedikit software
atau hardware codec menggunakannya. resolusi horizontal cb adalah setengah
dari Cr (dan seperempat dari resolusi horizontal Y). Ini memanfaatkan fakta
bahwa mata manusia memiliki sensitivitas spasial kurang untuk biru / kuning
daripada merah / hijau. NTSC mirip, dalam menggunakan resolusi yang lebih
rendah untuk biru / kuning dari merah / hijau, yang pada gilirannya memiliki
resolusi kurang dari luma.
4: 1: 1
Dalam 4: 1: 1 kroma subsampling, resolusi warna horisontal yang bermarkas,
dan bandwidth yang dibelah dua dibandingkan dengan tidak ada kroma
subsampling. Awalnya, 4: 1:. 1 kroma subsampling dari format DV tidak dianggap
disiarkan kualitas dan hanya diterima untuk low-end dan aplikasi konsumen [3]
[4] format Saat ini, DV berbasis (beberapa di antaranya menggunakan 4 : 1: 1
kroma subsampling) digunakan secara profesional dalam pengumpulan berita
elektronik dan di server playout. DV juga telah secara sporadis digunakan dalam
film dan di sinematografi digital.
Dalam sistem NTSC, jika luma adalah sampel sebesar 13,5 MHz, maka ini berarti
bahwa sinyal Cr dan Cb masing-masing akan sampel pada 3,375 MHz, yang
sesuai dengan Nyquist bandwidth maksimum 1,6875 MHz, sedangkan tradisional
"high-end siaran analog NTSC encoder "akan memiliki bandwidth Nyquist 1,5
MHz dan 0,5 MHz untuk saluran I / Q. Namun, di sebagian besar peralatan, TV
terutama murah set dan VHS / Betamax VCR saluran chroma hanya bandwidth
0,5 MHz untuk kedua Cr dan Cb (atau ekuivalen untuk I / Q). Dengan demikian
sistem DV benar-benar menyediakan bandwidth warna yang superior
dibandingkan dengan spesifikasi terbaik analog komposit untuk NTSC, meski
hanya memiliki 1/4 dari bandwidth kroma dari "penuh" sinyal digital.
Format yang menggunakan 4: 1: 1 kroma subsampling meliputi:
DVCPRO (NTSC dan PAL)
III-10 |
Pesantren Muadalah
| III-11
negatif (cahaya yang negatif tidak ada), nilai-nilai negatif akan efektif dipotong
dan nilai luma yang dihasilkan akan terlalu tinggi. [10] artefak serupa muncul
dalam contoh kurang buatan gradasi dekat merah yang cukup tajam / batas
hitam.
Penyaringan selama subsampling juga dapat menyebabkan warna untuk pergi
keluar dari gamut.
Terminologi
The Y'UV merujuk pada skema pengkodean analog sedangkan Y'CbCr mengacu
pada skema pengkodean digital. [Rujukan?] Salah satu perbedaan antara
keduanya adalah bahwa faktor skala pada komponen kroma (U, V, Cb, dan Cr)
berbeda. Namun, YUV istilah ini sering digunakan secara keliru untuk merujuk
Y'CbCr encoding. Oleh karena itu, ungkapan-ungkapan seperti "4: 2: 2 YUV"
selalu mengacu pada 4: 2: 2 Y'CbCr karena ada hanya ada hal seperti 4: x: x
dalam pengkodean analog (seperti YUV).
Dalam nada yang sama, pencahayaan istilah dan simbol Y sering digunakan
secara salah untuk merujuk kepada luma, yang dilambangkan dengan simbol Y '.
Perhatikan bahwa luma (Y ') dari rekayasa video yang menyimpang dari
luminance (Y) ilmu warna (seperti yang didefinisikan oleh CIE). Luma terbentuk
sebagai jumlah tertimbang gamma-dikoreksi (tristimulus) komponen RGB.
Luminance dibentuk sebagai jumlah ditimbang komponen linear (tristimulus)
RGB.
Dalam prakteknya, CIE simbol Y sering salah digunakan untuk menunjukkan
luma. Pada tahun 1993, SMPTE mengadopsi Pedoman Teknik EG 28,
mengklarifikasi dua hal. Perhatikan bahwa simbol utama 'digunakan untuk
menunjukkan koreksi gamma.
Demikian pula, chroma / chrominance rekayasa video yang berbeda dari
chrominance ilmu warna. Kroma / chrominance teknik video yang terbentuk dari
komponen tristimulus tertimbang, bukan komponen linear. Dalam praktek
rekayasa video, istilah chroma, chrominance, dan saturasi sering digunakan
secara bergantian untuk merujuk chrominance.
| III-13