- 熵編碼
熵編碼是無損編碼。它對變換、量化后得到的系數(shù)和運(yùn)動信息,進(jìn)行進(jìn)一步的壓縮。
視頻編碼的基本框架(圖)
國際音視頻壓縮標(biāo)準(zhǔn)發(fā)展歷程
H.261
H.261標(biāo)準(zhǔn)是為ISDN設(shè)計,主要針對實時編碼和解碼設(shè)計,壓縮和解壓縮的信號延時不超過150ms,碼率px64kbps(p=1~30)。
H.261標(biāo)準(zhǔn)主要采用運(yùn)動補(bǔ)償?shù)膸g預(yù)測、DCT變換、自適應(yīng)量化、熵編碼等壓縮技術(shù)。 只有I幀和P幀,沒有B幀,運(yùn)動估計精度只精確到像素級。支持兩種圖像掃描格式:QCIF和CIF。
H.263
H.263標(biāo)準(zhǔn)是甚低碼率的圖像編碼國際標(biāo)準(zhǔn),它一方面以H.261為基礎(chǔ),以混合編碼為核心,其基本原理框圖和H.261十分相似,原始數(shù)據(jù)和碼流組織也相似;另一方面,H.263也吸收了MPEG等其它一些國際標(biāo)準(zhǔn)中有效、合理的部分,如:半像素精度的運(yùn)動估計、PB幀預(yù)測等,使它性能優(yōu)于H.261。
H.263使用的位率可小于64Kb/s,且傳輸比特率可不固定(變碼率)。H.263支持多種分辨率: SQCIF(128x96)、 QCIF、CIF、4CIF、16CIF。
與H.261和H.263相關(guān)的國際標(biāo)準(zhǔn)
與H.261有關(guān)的國際標(biāo)準(zhǔn)
H.320:窄帶可視電話系統(tǒng)和終端設(shè)備;
H.221:視聽電信業(yè)務(wù)中64~1 920Kb/s信道的幀結(jié)構(gòu);
H.230:視聽系統(tǒng)的幀同步控制和指示信號;
H.242:使用直到2Mb/s數(shù)字信道的視聽終端的系統(tǒng)。
與H.263有關(guān)的國際標(biāo)準(zhǔn)
H.324:甚低碼率多媒體通信終端設(shè)備;
H.223:甚低碼率多媒體通信復(fù)合協(xié)議;
H.245:多媒體通信控制協(xié)議;
G.723.1.1:傳輸速率為5.3Kb/s和6.3Kb/s的語音編碼器。
JPEG
國際標(biāo)準(zhǔn)化組織于1986年成立了JPEG(Joint Photographic Expert Group)聯(lián)合圖片專家小組,主要致力于制定連續(xù)色調(diào)、多級灰度、靜態(tài)圖像的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn)。常用的基于離散余弦變換(DCT)的編碼方法,是JPEG算法的核心內(nèi)容。
MPEG-1/2
MPEG-1標(biāo)準(zhǔn)用于數(shù)字存儲體上活動圖像及其伴音的編碼,其數(shù)碼率為1.5Mb/s。 MPEG-1的視頻原理框圖和H.261的相似。
MPEG-1視頻壓縮技術(shù)的特點:1. 隨機(jī)存??;2. 快速正向/逆向搜索;3 .逆向重播;4. 視聽同步;5. 容錯性;6. 編/解碼延遲。MPEG-1視頻壓縮策略:為了提高壓縮比,幀內(nèi)/幀間圖像數(shù)據(jù)壓縮技術(shù)必須同時使用。幀內(nèi)壓縮算法與JPEG壓縮算法大致相同,采用基于DCT的變換編碼技術(shù),用以減少空域冗余信息。幀間壓縮算法,采用預(yù)測法和插補(bǔ)法。預(yù)測誤差可在通過DCT變換編碼處理,進(jìn)一步壓縮。幀間編碼技術(shù)可減少時間軸方向的冗余信息。
MPEG-2被稱為“21世紀(jì)的電視標(biāo)準(zhǔn)”,它在MPEG-1的基礎(chǔ)上作了許多重要的擴(kuò)展和改進(jìn),但基本算法和MPEG-1相同。
MPEG-4
MPEG-4標(biāo)準(zhǔn)并非是MPEG-2的替代品,它著眼于不同的應(yīng)用領(lǐng)域。MPEG-4的制定初衷主要針對視頻會議、可視電話超低比特率壓縮(小于64Kb/s)的需求。在制定過程中,MPEG組織深深感受到人們對媒體信息,特別是對視頻信息的需求由播放型轉(zhuǎn)向基于內(nèi)容的訪問、檢索和操作。
MPEG-4與前面提到的JPEG、MPEG-1/2有很大的不同,它為多媒體數(shù)據(jù)壓縮編碼提供了更為廣闊的平臺,它定義的是一種格式、一種框架,而不是具體算法,它希望建立一種更自由的通信與開發(fā)環(huán)境。于是MPEG-4新的目標(biāo)就是定義為:支持多種多媒體的應(yīng)用,特別是多媒體信息基于內(nèi)容的檢索和訪問,可根據(jù)不同的應(yīng)用需求,現(xiàn)場配置解碼器。編碼系統(tǒng)也是開放的,可隨時加入新的有效的算法模塊。應(yīng)用范圍包括實時視聽通信、多媒體通信、遠(yuǎn)地監(jiān)測/監(jiān)視、VOD、家庭購物/娛樂等。
JVT:新一代的視頻壓縮標(biāo)準(zhǔn)
JVT是由ISO/IEC MPEG和ITU-T VCEG成立的聯(lián)合視頻工作組(Joint Video Team),致力于新一代數(shù)字視頻壓縮標(biāo)準(zhǔn)的制定。
JVT標(biāo)準(zhǔn)在ISO/IEC中的正式名稱為:MPEG-4 AVC(part10)標(biāo)準(zhǔn);在ITU-T中的名稱:H.264(早期被稱為H
H264/AVC
H264集中了以往標(biāo)準(zhǔn)的優(yōu)點,并吸收了以往標(biāo)準(zhǔn)制定中積累的經(jīng)驗, 采用簡潔設(shè)計,使它比MPEG4更容易推廣。H.264創(chuàng)造性了多參考幀、多塊類型、整數(shù)變換、幀內(nèi)預(yù)測等新的壓縮技術(shù),使用了更精細(xì)的分象素運(yùn)動矢量(1/4、1/8)和新一代的環(huán)路濾波器,使得壓縮性能大大提高,系統(tǒng)更加完善。
H.264主要有以下幾大優(yōu)點:
- 高效壓縮:與H.263+和MPEG4 SP相比,減小50%比特率
- 延時約束方面有很好的柔韌性
- 容錯能力
- 編/解碼的復(fù)雜性可伸縮性
- 解碼全部細(xì)節(jié):沒有不匹配
- 高質(zhì)量應(yīng)用
- 網(wǎng)絡(luò)友善
二、監(jiān)控中的視頻編碼技術(shù):
目前監(jiān)控中主要采用MJPEG、MPEG1/2、MPEG4(SP/ASP)、H.264/AVC等幾種視頻編碼技術(shù)。對于最終用戶來言他最為關(guān)心的主要有:清晰度、存儲量(帶寬)、穩(wěn)定性還有價格。采用不同的壓縮技術(shù),將很大程度影響以上幾大要素。
MJPEG
MJPEG(Motion JPEG)壓縮技術(shù),主要是基于靜態(tài)視頻壓縮發(fā)展起來的技術(shù),它的主要特點是基本不考慮視頻流中不同幀之間的變化,只單獨對某一幀進(jìn)行壓縮。
MJPEG壓縮技術(shù)可以獲取清晰度很高的視頻圖像,可以動態(tài)調(diào)整幀率、分辨率。但由于沒有考慮到幀間變化,造成大量冗余信息被重復(fù)存儲,因此單幀視頻的占用空間較大,目前流行的MJPEG技術(shù)最好的也只能做到3K字節(jié)/幀,通常要8~20K!
MPEG-1/2
MPEG-1標(biāo)準(zhǔn)主要針對SIF標(biāo)準(zhǔn)分辨率(NTSC制為352X240;PAL制為352X288)的圖像進(jìn)行壓縮. 壓縮位率主要目標(biāo)為1.5Mb/s.較MJPEG技術(shù),MPEG1在實時壓縮、每幀數(shù)據(jù)量、處理速度上有顯著的提高。但MPEG1也有較多不利地方:存儲容量還是過大、清晰度不夠高和網(wǎng)絡(luò)傳輸困難。
MPEG-2 在MPEG-1基礎(chǔ)上進(jìn)行了擴(kuò)充和提升,和MPEG-1向下兼容,主要針對存儲媒體、數(shù)字電視、高清晰等應(yīng)用領(lǐng)域,分辨率為:低(352x288),中(720x480),次高(1440x1080),高(1920x1080)。MPEG-2視頻相對MPEG-1提升了分辨率,滿足了用戶高清晰的要求,但由于壓縮性能沒有多少提高,使得存儲容量還是太大,也不適和網(wǎng)絡(luò)傳輸。
MPEG-4
MPEG-4視頻壓縮算法相對于MPEG-1/2在低比特率壓縮上有著顯著提高,在CIF(352*288)或者更高清晰度(768*576)情況下的視頻壓縮,無論從清晰度還是從存儲量上都比MPEG1具有更大的優(yōu)勢,也更適合網(wǎng)絡(luò)傳輸。另外MPEG-4可以方便地動態(tài)調(diào)整幀率、比特率,以降低存儲量。
MPEG-4由于系統(tǒng)設(shè)計過于復(fù)雜,使得MPEG-4難以完全實現(xiàn)并且兼容,很難在視頻會議、可視電話等領(lǐng)域?qū)崿F(xiàn),這一點有點偏離原來地初衷。另外對于中國企業(yè)來說還要面臨高昂的專利費(fèi)問題,目前規(guī)定:
- 每臺解碼設(shè)備需要交給MPEG-LA 0.25美元
- 編碼/解碼設(shè)備還需要按時間交費(fèi)(4美分/天=1.2美元/月 =14.4美元/年)
H.264/AVC
H.264集中了以往標(biāo)準(zhǔn)的優(yōu)點,在許多領(lǐng)域都得到突破性進(jìn)展,使得它獲得比以往標(biāo)準(zhǔn)好得多整體性能:
- 和H.263+和MPEG-4 SP相比最多可節(jié)省50%的碼率,使存儲容量大大降低;
- H.264在不同分辨率、不同碼率下都能提供較高的視頻質(zhì)量;
- 采用“網(wǎng)絡(luò)友善”的結(jié)構(gòu)和語法,使其更有利于網(wǎng)絡(luò)傳輸。
H.264采用簡潔設(shè)計,使它比MPEG4更容易推廣,更容易在視頻會議、視頻電話中實現(xiàn),更容易實現(xiàn)互連互通,可以簡便地和G.729等低比特率語音壓縮組成一個完整的系統(tǒng)。
MPEG LA吸收MPEG-4的高昂專利費(fèi)而使它難以推廣的教訓(xùn),MPEG LA制定了以下低廉的H.264收費(fèi)標(biāo)準(zhǔn):H.264廣播時基本不收費(fèi);產(chǎn)品中嵌入H.264編/解碼器時,年產(chǎn)量10萬臺以下不收取費(fèi),超過10萬臺每臺收取0.2美元,超過500萬臺每臺收取0.1美元。低廉的專利費(fèi)使得中國H.264監(jiān)控產(chǎn)品更容易走向世界。
監(jiān)控中視頻編碼分辨率的選擇
目前監(jiān)控行業(yè)中主要使用以下分辨率:SQCIF、QCIF、CIF、4CIF。
SQCIF和QCIF的優(yōu)點是存儲量低,可以在窄帶中使用,使用這種分辨率的產(chǎn)品價格低廉;缺點是圖像質(zhì)量往往很差、不被用戶所接受。
CIF是目前監(jiān)控行業(yè)的主流分辨率,它的優(yōu)點是存儲量較低,能在普通寬帶網(wǎng)絡(luò)中傳輸,價格也相對低廉,它的圖像質(zhì)量較好,被大部分用戶所接受。缺點是圖像質(zhì)量不能滿足高清晰的要求。
4CIF是標(biāo)清分辨率,它的優(yōu)點是圖像清晰。缺點是存儲量高,網(wǎng)絡(luò)傳輸帶寬要求很高,價格也較高。
分辨率新的選擇-528x384
2CIF(704x288)已被部分產(chǎn)品采用,用來解決CIF清晰度不夠高和4CIF存儲量高、價格高昂的缺點。但由于704x288只是水平分辨率的提升,圖像質(zhì)量提高不是特別明顯。
經(jīng)過測試,我們發(fā)現(xiàn)另外一種2CIF分辨率528x384,比704x288能更好解決CIF、4CIF的問題。特別是在512Kbps-1Mbps碼率之間,能獲得穩(wěn)定的高質(zhì)量圖像,滿足用戶較高圖像質(zhì)量的要求。目前這一分辨率已被許多網(wǎng)絡(luò)多媒體廣播所采用,被廣大用戶所接受。比如杭州網(wǎng)通網(wǎng)上影院是采用512x384分辨率,在768k下能穩(wěn)定地獲得近似DVD的圖像質(zhì)量