1、引言數(shù)字技術(shù)的發(fā)展帶動了整個社會的不斷進步,但數(shù)字化技術(shù)的發(fā)展同時也帶來了“信息爆炸”。為了使信息更為方便的進行傳輸和存儲,根據(jù)信息之間的相關(guān)性,去除信息冗余,對信息數(shù)據(jù)進行壓縮,那是十分必要的。[1,2]
為此,人們采用由輪廓、紋理定義的“區(qū)域”來表征視覺數(shù)據(jù),這些區(qū)域?qū)?yīng)的是對象或?qū)ο蟮囊徊糠帧_@種方法縮短了實際技術(shù)系統(tǒng)與人眼的視覺系統(tǒng)之間的距離,人眼視覺特性會強化某些視覺數(shù)據(jù),而忽略某些對視覺效果無關(guān)緊要的信息。采樣、量化后得到的原始數(shù)據(jù)必須力求變換成符合人眼視覺特性的表征方式,一旦得到了這些區(qū)域,接下來就是將屬于同一視覺對象的各個區(qū)域連接起來。這種表征方式不僅可以實現(xiàn)對視頻數(shù)據(jù)的高效壓縮,也為實現(xiàn)基于對象、區(qū)域的一些新功能鋪平了道路。這種視頻編碼的概念已被廣泛接受,并且已經(jīng)成為新的圖像/視頻編碼標(biāo)準(zhǔn)——MPEG-4的基礎(chǔ)。
2、編碼結(jié)構(gòu)在基于對象的視頻編碼中,編碼的基本單元是對象,基于對象的編碼主要是針對紋理、形狀、運動這三種信息的編碼技術(shù)。圖1所示的是可以對任意形狀的視頻對象進行編碼的通用框架。從圖1中可以看出,編碼框架中主要包括三個關(guān)鍵模塊,即形狀、運動和紋理編碼模塊。[2]
圖1 基于對象的信息編碼通用框架
總的說來,基于對象的視頻編碼過程可以分三步進行:
⑴ 從原始視頻流中采用全自動、半自動、人工等方法分割出視頻對象。
⑵ 對視頻對象進行編碼,對不同視頻對象的運動信息、形狀信息和紋理信息分配不同的碼字。
⑶ 對各個視頻對象的碼流進行復(fù)合。
3、結(jié)構(gòu)與語法MPEG-4標(biāo)準(zhǔn)中定義的中心概念是AV對象(audio-visualobject),這一概念是基于對象表征方法的基礎(chǔ)。MPEG-4的編碼機制是基于1616像素宏塊來設(shè)計的,不僅可以與現(xiàn)有的標(biāo)準(zhǔn)兼容,還便于對編碼進行更好的擴展。
MPEG-4的視頻碼流提供了對視頻場景的分層描述,如圖2所示。
分層的每一級都可以通過碼流中被稱為初始碼的特殊碼值進行訪問。用來描述場景的分層級為:
⒈ 視頻對象序列(VS,video objectsequence):完整的MPEG-4場景,可以包括任何二維或三維自然和合成對象以及它們的增強層。
⒉ 視頻對象(VO,video object ):一個視頻對象對應(yīng)著場景中的一個特定對象,可以是任意形狀的對象,也可以是一個矩形幀。
⒊ 視頻對象層(VOL,video object layer):根據(jù)應(yīng)用的具體要求,每一個視頻對象都可以用分級或不分級的方式進行編碼,用視頻對象層來表征。VOL提供了對可分級編碼的支持。一個視頻對象可以用空間或時間分級來編碼,分辨率可以從粗糙到精細,譯碼端可以根據(jù)可用帶寬、計算功率、用戶需求等參數(shù)獲得期望的分辨率。視頻對象層包括:基本層和增強層?;緦涌梢杂卸鄠€,每一層表示一種分辨率。
⒋ 視頻對象平面組(GOV, group of video object planes):GOV可以提供對碼流的隨機訪問點,GOV是任選的。
⒌ 視頻對象平面(VOP,video object plane):一個VOP是對一個視頻對象的時間采樣,包括視頻對象的運動參數(shù)、形狀信息和紋理數(shù)據(jù),對VOP編碼就是針對某一時刻該幀畫面VO的形狀、運動、紋理等信息進行編碼[3,4]。
圖2 MPEG-4的視頻碼流邏輯結(jié)構(gòu)圖
4、壓縮系統(tǒng)應(yīng)用設(shè)計本系統(tǒng)通過MAP-CA為核心的處理器設(shè)計一個視頻頻壓縮系統(tǒng)的原理框圖如圖3所示。
MAP-CA寬帶信號處理器(BSP)。主要包含一個超長指令字處理器內(nèi)核(The VLIW core)、一個可編程位流協(xié)處理器(TheVLx)、視頻濾波協(xié)處理器、顯示刷新控制器和豐富的數(shù)字I/O接口等。MAP-CA支持各種用軟件實現(xiàn)的視頻、圖像以及信號的壓縮和解壓縮,這種軟件實現(xiàn)的算法相對硬件實現(xiàn)有很大的優(yōu)越性,升級非常方便。
MAP-CA的硬件接口包括視頻輸入輸出接口、音頻輸入輸出接口、PCI總線接口、SDRAM接口、顯示控制器接口、I2C接口、ROM控制器接口和標(biāo)準(zhǔn)的在線可編程JTAG接口等。
由于MAP-CA的強大功能,使其特別適合應(yīng)用于多媒體信號處理的各種產(chǎn)品當(dāng)中,如機頂盒、數(shù)字電視、視頻會議系統(tǒng)、醫(yī)用圖像產(chǎn)品、數(shù)字視頻編輯設(shè)備和辦公自動化產(chǎn)品等。此外,由于多媒體信號處理的核心工作都是基于MAP-CA/BSP-15的軟件平臺,因此我們可以方便地通過增加、刪除或者增強一些功能模塊來對我們的最終系統(tǒng)進行改進,具有高度的針對性、靈活性,所以MAP-CA/BSP-15是多媒體信號處理應(yīng)用的一個現(xiàn)成有效的解決方案。
系統(tǒng)的設(shè)計目標(biāo):以MAP-CA為核心處理器設(shè)計一個視頻壓縮處理系統(tǒng),該系統(tǒng)可插在標(biāo)準(zhǔn)PCI槽上,作為視頻壓縮卡,配以相應(yīng)的軟件可實時處理視頻信號:采集、壓縮、存盤及讀盤、解壓、輸出等。
實現(xiàn)的系統(tǒng)將輸入的模擬視頻信號經(jīng)過視頻編碼器進行模數(shù)轉(zhuǎn)換和數(shù)據(jù)格式處理后,得到標(biāo)準(zhǔn)的ITU-RBT.656格式的數(shù)字視頻流送給MAP-CA處理,實現(xiàn)視頻的MPEG-4壓縮處理。還可將壓縮后的數(shù)據(jù)解碼,并轉(zhuǎn)換為ITU-RBT.656格式輸出的視頻信號通過視頻編碼器進行數(shù)模轉(zhuǎn)換和格式變換,變成符合國際標(biāo)準(zhǔn)的NTSC/PAL制式的S-VIDEO電視信號的輸出。另外系統(tǒng)外接2MB的FLASH ROM存儲器作為系統(tǒng)的啟動電路和非易失存儲器;還接有64MB的PC133SDRAM內(nèi)存,作為系統(tǒng)程序運行和變量存儲的空間;通過PCI橋與PC機的PCI插槽直接相連,傳送到內(nèi)存中,不占用CPU資源。[5,6]
圖3 視頻壓縮系統(tǒng)的原理框圖
5、軟件開發(fā)介紹MAP-CA可以完全用C語言編程,不需要任何低級語言。為此,Equator技術(shù)公司提供了一套名叫iMMediaTools的軟件開發(fā)包,其中包括一個優(yōu)化的并行C語言編譯器、FIRtree媒體本質(zhì)擴展C語言、匯編器、連接器、源代碼調(diào)試器、兩個虛擬機仿真器和分類的庫函數(shù)。
MAP-CA開發(fā)系統(tǒng)包括帶有FIRtree媒體本質(zhì)擴展 C語言的iMedialC編譯器。FIRtree是專門的單指令多數(shù)據(jù)流形式的高速媒體處理擴展語言。這個C編譯器運用了大量的優(yōu)化和全局配置技術(shù),把涉及硬件的操作留給編譯器完成轉(zhuǎn)換,從而使編程人員不需要使用費時費力的匯編語言就可以完全發(fā)揮硬件的全部性能。
6、結(jié)論本系統(tǒng)支持MPEG-4、I幀、IP幀等多種壓縮格式,壓縮質(zhì)量可調(diào)。在+/-256H,+/-256V的廣泛范圍內(nèi),可以半幀的精度進行四倍運動估計。在極低碼率下傳輸,畫面質(zhì)量仍能取得滿意的效果。系統(tǒng)支持定碼流壓縮和動態(tài)碼流壓縮。前者在場景活動變化劇烈的情況下存儲容量不變,圖像質(zhì)量下降。后者質(zhì)量不變,而自動調(diào)節(jié)碼流。支持可變位速率自適應(yīng)記錄方式,通過動態(tài)偵測場景變化,自適應(yīng)調(diào)整碼流。通過靈活的碼率控制方式,可以自由設(shè)定定帶寬和定碼流的錄像和傳輸方式。帶寬和碼流任意可調(diào)。系統(tǒng)的具體技術(shù)指標(biāo)如表1所示
表1 可實現(xiàn)技術(shù)指標(biāo)
參考文獻[1] 劉毓敏,數(shù)字視音頻技術(shù)與應(yīng)用 [M],北京:電子工業(yè)出版社,2003,18~22
[2] 田棟,低速率視頻傳輸關(guān)鍵技術(shù)的研究 [D],北京:北京工業(yè)大學(xué),2001,8~12
[3] Zhong Yu ,Automatic caption localization in compressed video [J],IEEE Transcation on pattern anlysis and machine in telligence , 2000 ,22(4):385~392
[4] 李 楓,宋 彥,戴禮榮,王任華,遠程多媒體監(jiān)控系統(tǒng)的軟硬件開發(fā) [J],電子技術(shù)應(yīng)用,2000,26(12),84~86
[5] S.Karthikeyan , A.Tamminneedi and E.K.F.lee.Design of Low-VoltageFront-End Interface for Switched-Opamp Circuits [J] , IEEE 115~119
[6] Mathieu.B,Melchior.P,Oustaloup.A,Ceyral.Ch. FractionalDifferentiation for Edge Detection[J],SignalProcessing,2003,Vol.83:2421~2432