MPEG是Moving Picture ExpertsGroup的簡稱。這個(gè)名字本來的含義是指一個(gè)研究視頻和音頻編碼標(biāo)準(zhǔn)的小組?,F(xiàn)在我們所說的MPEG泛指又該小組制定的一系列視頻編碼標(biāo)準(zhǔn)。該小組于1988年組成,至今已經(jīng)制定了MPEG-1、MPEG-2、MPEG-3、MPEG-4、MPEG-7等多個(gè)標(biāo)準(zhǔn),MPEG-21正 在制定中。
MPEG到目前為止已經(jīng)制定并正在制定以下和視頻相關(guān)的標(biāo)準(zhǔn):
媒體codec在于MPEG-1,MPEG-2,MPEG-4,如上圖所示。
圖中名稱解釋:在圖中DVD地球人都知道,何為DVB?
DVB:數(shù)字視頻廣播(DVB, Digital Video Broadcasting),是由“DVB Project”維護(hù)的一系列為國際所承認(rèn)的數(shù)字電視公開標(biāo)準(zhǔn)。DVB系統(tǒng)傳輸方式有如下幾種:
- 衛(wèi)星電視(DVB-S 及 DVB-S2)
- 有線電視(DVB-C)
- 無線電視(DVB-T)
- 手持地面無線(DVB-H)
這些標(biāo)準(zhǔn)定義了傳輸系統(tǒng)的物理層與數(shù)據(jù)鏈路層。設(shè)備通過同步并行接口(synchronous parallel interface,SPI),同步串行接口(synchronous serial interface, SSI),或異步串行接口(asynchronousserial interface,ASI)與物理層交互。數(shù)據(jù)以MPEG-2傳輸流的方式傳輸,并要求符合更嚴(yán)格的限制(DVB-MPEG)。對(duì)移動(dòng)終端即時(shí)壓縮傳輸數(shù)據(jù)的標(biāo)準(zhǔn)(DVB-H)目前正處于測(cè)試之中。
這些傳輸方式的主要區(qū)別在于使用的調(diào)制方式,因?yàn)椴煌鼈儜?yīng)用的頻率帶寬的要求不同。利用高頻載波的DVB-S使用QPSK調(diào)制方式,利用低頻載波的DVB-C使用QAM-64 調(diào)制方式,而利用VHF 及 UHF載波的DVB-T使用COFDM調(diào)制方式。
除音頻與視頻傳輸外,DVB也定義了帶回傳信道(DVB-RC)的數(shù)據(jù)通信標(biāo)準(zhǔn)(DVB-DATA)。
DVB的codec,視頻為:MPEG-2,MPEG-4 AVC;音頻為:MP3,AC-3,AAC,HE-AAC。
MPEG-1
MPEG-1作為ISO/IEC11172正式發(fā)布。
MPEG-1較早的視頻編碼,質(zhì)量比較差,主要用于 CD-ROM存儲(chǔ)視頻,國內(nèi)最為大家熟悉的就 是 VCD(Video CD),他的視頻編碼就是采用MPEG-1。它是為CD光盤介質(zhì)定制的視頻和音頻壓縮格式。一張70分鐘的CD光盤傳輸速率大約在1.4Mbps。而MPEG-1采用了塊方式的運(yùn)動(dòng)補(bǔ)償、離散余弦變換(DCT)、量化等技術(shù),并為1.2Mbps傳輸速率進(jìn)行了優(yōu)化。MPEG-1 隨后被VideoCD采用作為內(nèi)核技術(shù)。MPEG-1的輸出質(zhì)量大約和傳統(tǒng)錄像機(jī)VCR,信號(hào)質(zhì)量相當(dāng),這也許是Video CD在發(fā)達(dá)國家未獲成功的原因。
MPEG-1音頻分三層,就是MPEG-1 Layer I, II, III,其中第三層協(xié)議也就是MPEG- 1 Layer 3,簡稱MP3。MP3目前已經(jīng)成為廣泛流傳的音頻壓縮技術(shù)。
MPEG-1有下面幾個(gè)部分:
MPEG-1的缺點(diǎn):
MPEG-2
MPEG-2內(nèi)容介紹
MPEG-2作為ISO/IEC 13818正式發(fā)布,通常用來為廣播信號(hào)提供視頻和音頻編碼, 包括衛(wèi)星電視、有線電視等。MPEG-2經(jīng)過少量修改后,也成為DVD產(chǎn)品的內(nèi)核技術(shù)。
MPEG-2有11部分,具體如下:
第一部(Part 1):系統(tǒng)-描述視頻和音頻的同步和多路技術(shù)
正式名稱是ISO/IEC 13818-1或 ITU-T中的H.222.0
MPEG-2的系統(tǒng)描述部分(第1部分)定義了傳輸流,它用來一套在非可靠介質(zhì)上傳輸數(shù)字視頻信號(hào)和音頻信號(hào)的機(jī)制,主要用在廣播電視領(lǐng)域。
定義了兩個(gè)不同但相關(guān)的容器格式,MPEG transportstream和MPEG programstream,也就是圖中的TS和PS。MPEG傳輸流(TS)為攜帶可損數(shù)字視頻和音頻,媒體流的開始和結(jié)束可以不標(biāo)識(shí)出來,就像廣播或者磁帶,其中的例子包括ATSC,DVB,SBTVD 和HDV。MPEG-2系統(tǒng)還定義了MPEG節(jié)目流(PS),它為以文件為基礎(chǔ)的媒體設(shè)計(jì)一個(gè)容器格式,用于硬盤驅(qū)動(dòng)器,光盤和閃存。
MPEG-2PS(節(jié)目流)是為在存儲(chǔ)介質(zhì)保存視頻信息而開發(fā)的。MPEG-2 TS(傳輸流)是為在網(wǎng)絡(luò)傳輸視頻信息而開發(fā)的。目前,MPEG-2TS最廣泛地應(yīng)用是DVB系統(tǒng)。TS流與PS流的區(qū)別在于TS流的包結(jié)構(gòu)是固定 度的,而PS流的包結(jié)構(gòu)是可變長度。PS包與TS包在結(jié)構(gòu)上的這種差異,導(dǎo)致了它們對(duì)傳輸誤碼具有不同的抵抗能力,因而應(yīng)用的環(huán)境也有所不同。TS碼流由于采用了固定長度的包結(jié)構(gòu),當(dāng)傳輸誤碼破壞了某一TS包的同步信息時(shí),接收機(jī)可在固定的位置檢測(cè)它后面包中的同步信息,從而恢復(fù)同步,避免了信息丟失。而PS包由于長度是變化的,一旦某一PS包的同步信息丟失,接收機(jī)無法確定下一包的同步位置,就會(huì)造成失步,導(dǎo)致嚴(yán)重的信息丟失。因此,在信道環(huán)境較為惡劣,傳輸誤碼較高時(shí),一般采用TS碼流;而在信道環(huán)境較好,傳輸誤碼較低時(shí),一般采用PS碼流由于TS碼流具有較強(qiáng)的抵抗傳輸誤碼的能力,因此目前在傳輸媒體中進(jìn)行傳輸?shù)腗PEG-2碼流 基本上都采用了TS碼流的包格。
第二部(Part 2):視頻-視頻壓縮
正式名稱是ISO/IEC 13818-2或 ITU-T H.262。
提供隔行掃描和非隔行掃描視頻信號(hào)的壓縮編解碼器。
MPEG-2的第二部分即視頻部分和MPEG-1類似,但是它提供對(duì)隔行掃描視頻顯示模式的支持(隔行掃描廣泛應(yīng)用在廣播電視領(lǐng)域)。MPEG-2視頻并沒有對(duì)低位速率(小于1Mbps)進(jìn)行優(yōu)化,在3Mbit/s及以上位速率情況下,MPEG-2明顯優(yōu)于MPEG-1。MPEG-2向后兼容,也即是說,所有符合標(biāo)準(zhǔn)的MPEG-2解碼器也能夠正常播放MPEG-1視頻流。
MPEG-2技術(shù)也應(yīng)用在了HDTV傳輸系統(tǒng)中。MPEG-2不光運(yùn)用于 DVD-Video ,現(xiàn)在大部 分 HDTV(高清電視)也采用 MPEG-2 編碼,分辨率達(dá)到了 1920x1080。由于MPEG-2 的普及,本來為 HDTV 準(zhǔn)備 的 MPEG-3 最終宣告放棄。
MPEG-2視頻通常包含多個(gè)GOP(Group OfPictures),每一個(gè)GOP包含多個(gè)幀(frame)。幀的幀類(frametype)通常包括I-幀(I-frame)、P-幀(P-frame)和B-幀(B-frame)。其中I-幀采用幀內(nèi)編碼,P-幀采用前向估計(jì),B-幀采用雙向估計(jì)。一般來說輸入視頻格式是25(CCIR標(biāo)準(zhǔn))或者29.97(FCC)幀/秒。
MPEG-2支持隔行掃描和逐行掃描。在逐行掃描模式下,編碼的基本單元是幀。在隔行掃描模式下,基本編碼可以是幀,也可以是場(chǎng)(field)。
原始輸入圖像首先被轉(zhuǎn)換到Y(jié)CbCr顏色空間。其中Y是亮度,Cb和Cr是兩個(gè)色度通道。Cb指藍(lán)色色度,Cr指紅色色度。對(duì)于每一通道,首先采用塊分區(qū),然后形成“宏塊”(macroblocks),宏塊構(gòu)成了編碼的基本單元。每一個(gè)宏塊再分區(qū)成8x8的小塊。色度通道分區(qū)成小塊的數(shù)目取決于初始參數(shù)設(shè)置。例如,在常用的4:2:0格式下,每個(gè)色度宏塊只采樣出一個(gè)小塊,所以三個(gè)通道宏塊能夠分區(qū)成的小塊數(shù)目是4+1+1=6個(gè)。
對(duì)于I-幀,整幅圖像直接進(jìn)入編碼過程。對(duì)于P-幀和B-幀,首先做運(yùn)動(dòng)補(bǔ)償。通常來說,由于相鄰幀之間的相關(guān)性很強(qiáng),宏塊可以在前幀和后幀中對(duì)應(yīng)相近的位置找到相似的區(qū)域匹配的比較好,這個(gè)偏移量作為運(yùn)動(dòng)向量被記錄下來,運(yùn)動(dòng)估計(jì)重構(gòu)的區(qū)域的誤差被送到編碼器中編碼。
對(duì)于每一個(gè)8×8小塊,離散余弦變換把圖像從空間域轉(zhuǎn)換到頻域。得到的變換系數(shù)被量化并重新組織排列順序,從而增加長零的可能性。之后做游程編碼(run-length code)。最后作哈夫曼編碼(Huffman Encoding)。
I幀編碼是為了減少空間域冗余,P幀和B幀是為了減少時(shí)間域冗余。
GOP是由固定模式的一系列I幀、P幀、B幀組成。常用的結(jié)構(gòu)由15個(gè)幀組成,具有以下形式IBBPBBPBBPBBPBB。GOP中各個(gè)幀的比例的選取和帶寬、圖像的質(zhì)量要求有一定關(guān)系。例如因?yàn)锽幀的壓縮時(shí)間可能是I幀的三倍,所以對(duì)于計(jì)算能力不強(qiáng)的某些實(shí)時(shí)系統(tǒng),可能需要減少B幀的比例。
MPEG-2輸出的比特流可以是勻速或者變速的。最大比特率,例如在DVD應(yīng)用上,可達(dá)10.4 Mbit/s。如果要使用固定比特率,量化尺度就需要不斷的調(diào)節(jié)以產(chǎn)生勻速的比特流。但是,提高量化尺度可能帶來可視的失真效果。比如馬賽克現(xiàn)象。
第三部(Part 3):音頻-音頻壓縮
MPEG-2的第三部分定義了音頻壓縮標(biāo)準(zhǔn)。MPEG-2BC(Backwardscompatible),后向兼容MPEG-1音頻。該部分改進(jìn)了MPEG-1的音頻壓縮,支持兩通道以上的音頻,可高達(dá)5.1多聲道。MPEG-2音頻壓縮部分也保持了向后兼容的特點(diǎn)(也稱為MPEG - 2 BC),允許的MPEG - 1音頻解碼器解碼兩個(gè)主立體聲組件。還定義音頻MPEG-1Layer I, II ,III額外的比特率和采樣頻率。
例如mp2,是MPEG-1 Audio level 2,標(biāo)準(zhǔn)有:ISO/IEC 11172-3, ISO/IEC 13818-3。MPEG-1 Layer II 定義在 ISO/IEC 11172-3,也就是MPEG-1的第三部分,在ISO/IEC13818-3,也就是MPEG-2的第3部分定義擴(kuò)展。
第四部(Part 4):測(cè)試規(guī)范
描述測(cè)試程序。
第五部(Part 5):仿真軟件
描述軟件仿真系統(tǒng)。
第六部(Part 6):DSM-CC(Digital Storage Media Command and Control)擴(kuò)展
描述DSM-CC(數(shù)字存儲(chǔ)媒體命令及控制)擴(kuò)展。
第七部(Part 7):Advanced Audio Coding (AAC)
MPEG-2的第七部分定義了不能向后兼容的音頻壓縮(也成為MPEG-2 NBC)。也成為MPEG-2 NBC(not-backwards compatible MPEG-1Audio)。該部分提供了更強(qiáng)的音頻功能。通常我們所說的MPEG-2 AAC指的就是這一部分。AAC即Advanced AudioCoding。 AAC是比以前的MPEG音頻標(biāo)準(zhǔn)的效率,并在某個(gè)程度上沒有它的前任MPEG-1Layer3(MP3)復(fù)雜,它沒有復(fù)雜的混合濾波器(hybrid filterbank)。它支持從1到48個(gè)通道,采樣率從8-96千赫,多渠道,多語種和多節(jié)目(multiprogram)能力。AAC也在MPEG-4標(biāo)準(zhǔn)的第3部分描述。
第八部(Part 8):
已取消。
第九部(Part 9):實(shí)時(shí)接口擴(kuò)展
實(shí)時(shí)接口擴(kuò)展。
第十部(Part 10):DSM-CC一致性擴(kuò)展
DSM-CC一致性擴(kuò)展。
第十一部(Part 11):IP
知識(shí)產(chǎn)權(quán)管理(IPMP)。XML定義在ISO/IEC 23001-3。MPEG-2內(nèi)核技術(shù)大約涉及640個(gè)專利,這些專利主要集中在20間公司和一間大學(xué)。
MPEG-2音頻
MPEG-2提供新的音頻編碼方式。在第3部分和第7部分介紹。
第三部分
MPEG-2 BC (backward compatible with MPEG-1 audio formats),使用一半的取樣速率處理低位速率的音頻,(MPEG-1 Layer 1/2/3 LSF),多通道編碼達(dá)到5.1個(gè)通道。
第七部分
MPEG-2 NBC (Non-Backward Compatible),提供MPEG-2 AAC,且不能向后兼容,多通道編碼達(dá)到 48個(gè)通道。
MPEG-2 profile和level
MPEG-2提供廣泛的應(yīng)用,對(duì)于大部分的應(yīng)用,即不現(xiàn)實(shí)的也過于昂貴,去支持整個(gè)標(biāo)準(zhǔn),通常只支持子集,因此標(biāo)準(zhǔn)定義了profile和level來表示這些子集。profile定義特性相關(guān),例如壓縮算法,色度格式等。level定義性能相關(guān),例如最大比特率,最大幀大小等。一個(gè)應(yīng)用程序應(yīng)當(dāng)通過profile和level來表示他的能力。profile和level的組合構(gòu)成MPEG-2視頻編碼標(biāo)準(zhǔn)在某種特定應(yīng)用下的子集。對(duì)某一輸入格式的圖像,采用特定集合的壓縮編碼工具,產(chǎn)生規(guī)定速率范圍內(nèi)的編碼碼流。例如一臺(tái)DVD播放機(jī)可以說,它支持最多的主要profile和主要level(通常寫為MP@ML)。
MPEG-2主要的profile:
名稱 | 英文 | 中文 | 圖像編碼類型 | 色度格式 YCbCr | 長寬比 | 伸縮模式 |
SP | Simple Profile | 簡單類 | I幀、P幀 | 4:2:0 | 4:3或16:9 | |
MP | Main Profile | 主類 | I幀、P幀、B幀 | 4:2:0 | 4:3 或16:9 | |
SNR | SNR Scalable profile | 信噪比分層類 | I幀、P幀、B幀 | 4:2:0 | 4:3 或16:9 | 信噪比可伸縮 |
Spatial | Spatially scalable profile | 空間可分層類 | I幀、P幀、B幀 | 4:2:0 | 4:3 或16:9 | 信噪比或空間可伸縮 |
442P | 4:2:2 Profile | I幀、P幀、B幀 | 4:2:2 | |||
HP | High profile | 高類 | I幀、P幀、B幀 | 4:2:0或 4:2:2 | 4:3 或16:9 | 信噪比或空間可伸縮 |
MPEG-2主要的level:
名稱 | 英文 | 幀頻 | 最大長×最大寬 | 每秒最大亮度樣本 (約為高×寬×幀頻率) | 最大比特率 (Mbit/s) |
LL | Low Level | 23.976, 24, 25, 29.97, 30 | 352×288 | 3,041,280 | 4 |
ML | Main Level | 23.976, 24, 25, 29.97, 30 | 720×576 | 10,368,000,例外為:HP中4:2:0為14,475,600,4:2:2為11,059,200 | 15 |
H-14 | High-1440 level | 23.976, 24, 25, 29.97, 30, 50, 59.94, 60 | 1440×1152 | 47,001,600,例外為:HP中4:2:0為62,668,800 | 60 |
HL | High level | 23.976, 24, 25, 29.97, 30, 50, 59.94, 60 | 1920×1152 | 62,668,800,例外為:HP中4:2:0為83,558,400 | 80 |
組合例子
Profile @ Level | Resolution (px) | Framerate max. (Hz) | Sampling | Bitrate (Mbit/s) | Example Application |
---|---|---|---|---|---|
SP@LL | 176 × 144 | 15 | 4:2:0 | 0.096 | Wireless handsets |
SP@ML | 352 × 288 | 15 | 4:2:0 | 0.384 | PDAs |
320 × 240 | 24 | ||||
MP@LL | 352 × 288 | 30 | 4:2:0 | 4 | Set-top boxes (STB) |
MP@ML | 720 × 480 | 30 | 4:2:0 | 15 (DVD: 9.8) | DVD, SD-DVB |
720 × 576 | 25 | ||||
MP@H-14 | 1440 × 1080 | 30 | 4:2:0 | 60 (HDV: 25) | HDV |
1280 × 720 | 30 | ||||
MP@HL | 1920 × 1080 | 30 | 4:2:0 | 80 | ATSC 1080i, 720p60, HD-DVB (HDTV). (Bitrate for terrestrial transmission is limited to 19.39Mbit/s) |
1280 × 720 | 60 | ||||
422P@LL | 4:2:2 | ||||
422P@ML | 720 × 480 | 30 | 4:2:2 | 50 | Sony IMX using I-frame only, Broadcast "contribution" video (I&P only) |
720 × 576 | 25 | ||||
422P@H-14 | 1440 × 1080 | 30 | 4:2:2 | 80 | Potential future MPEG-2-based HD products from Sony and Panasonic |
1280 × 720 | 60 | ||||
422P@HL | 1920 × 1080 | 30 | 4:2:2 | 300 | Potential future MPEG-2-based HD products from Panasonic |
1280 × 720 | 60 |
MPEG-2在DVD上的應(yīng)用
DVD中采用了 MPEG-2標(biāo)準(zhǔn)并引入如下技術(shù)參數(shù)限制: MPEG-2在DVB上的應(yīng)用 DVB-MPEG相關(guān)技術(shù)參數(shù): MPEG-2和NTSC 必須符合以下一種分辨率: 對(duì)YCbCr的補(bǔ)充資料 YCbCr不是一種絕對(duì)色彩空間,是YUV壓縮和偏移的版本。右圖為UV色版。 Y(Luma,Luminance)視訊,也就是灰階值。UV 視作表示彩度的C(Chrominance或Chroma)。主要的采樣(subsample)格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr4:1:1和 YCbCr 4:4:4。YUV的表示法稱為 A:B:C 表示法: * 4:4:4 表示完全取樣。 最常用Y:UV記錄的比重通常 1:1 或 2:1,DVD-Video 是以 YUV 4:2:0的方式記錄,也就是我們俗稱的I420,YUV4:2:0 并不是說只有U(即 Cb), V(即 Cr)一定為0,而是指U:V互相援引,時(shí)見時(shí)隱,也就是說對(duì)于每一個(gè)行,只有一個(gè)U或者V份量,如果一行是4:2:0的話,下一行就是4:0:2,再下一行是4:2:0...以此類推。 以上來自wiki資料的整理。
* 分辨率
o 720 x 480, 704 x 480, 352 x 480, 352 x 240 像素(NTSC制式)
o 720 x 576, 704 x 576, 352 x 576, 352 x 288 像素(PAL制式)
* 縱橫比
o 4:3
o 16:9
* 幀率(幀播放速度)
o 59.94 場(chǎng)/秒,23.976幀/秒,29.97幀/秒(NTSC)
o 50 場(chǎng)/秒,25幀/秒(PAL)
* 視頻+音頻 比特率
o 平均最大緩沖區(qū) 9.8 Mbit/s
o 峰值 15 Mbit/s
o 最小值 300 Kbit/s
* YUV 4:2:0
* 字幕支持
* 內(nèi)嵌字幕支持(NTSC only)
* 音頻
o LPCM編碼:48kHz或96kHz;16或24-bit;最多可達(dá)6聲道
o MPEG Layer 2 (MP2):48 kHz,可達(dá)5.1聲道
o 杜比數(shù)字-Dolby Digital(DD,也稱為AC-3):48 kHz,32-448 kbit/s,可達(dá)5.1聲道
o 數(shù)字家庭影院系統(tǒng)-Digital Theater Systems (DTS):754 kbit/s或1510 kbit/s
o NTSC制式DVD必須包含至少一道LPCM或Dolby Digital
o PAL制式DVD必須包含至少一道MPEG Layer 2、LPCM或者Dolby Digital
* GOP結(jié)構(gòu)
o 必須為GOP提供串行的頭信息
o GOP最大可含幀數(shù)目:18 (NTSC) / 15 (PAL)
* 必須符合以下一種分辨率:
o 720 × 480 像素,24/1.001,24,30/1.001或30幀/秒
o 640 × 480 像素,24/1.001,24,30/1.001或30幀/秒
o 544 × 480 像素,24/1.001,24,30/1.001或30幀/秒
o 480 × 480 像素,24/1.001,24,30/1.001或30幀/秒
o 352 × 480 像素,24/1.001,24,30/1.001或30幀/秒
o 352 × 240 像素,24/1.001,24,30/1.001或30幀/秒
o 720 × 576 像素,25幀/秒
o 544 × 576 像素,25幀/秒
o 480 × 576 像素,25幀/秒
o 352 × 576 像素,25幀/秒
o 352 × 288 像素,25幀/秒
o 1920 × 1080 像素,最多60幀/秒(1080i)
o 1280 × 720 像素,最多60幀/秒(720p)
o 720 × 576 像素,最多50幀/秒,25幀/秒(576i,576p)
o 720 × 480 像素,最多60幀/秒,30幀/秒(480i,480p)
o 640 × 480 像素,最多60幀/秒
注:1080i按 1920×1088像素編碼,但是最后8行在顯示時(shí)拋棄。
* 4:2:2 表示 2:1 的水平取樣,沒有垂直下采樣。
* 4:2:0 表示 2:1 的水平取樣,2:1 的垂直下采樣。
* 4:1:1 表示 4:1 的水平取樣,沒有垂直下采樣。
聯(lián)系客服