基于MPEG-4視頻圖像壓縮處理的研究與應(yīng)用

作者：仲叢久、張芝賢、關(guān)宗安　　單位：沈陽航空工業(yè)學(xué)院電子信息工程學(xué)院　　轉(zhuǎn)載：儀器儀表學(xué)報　　發(fā)布時間：2009-01-05

1、引言

數(shù)字技術(shù)的發(fā)展帶動了整個社會的不斷進步，但數(shù)字化技術(shù)的發(fā)展同時也帶來了“信息爆炸”。為了使信息更為方便的進行傳輸和存儲，根據(jù)信息之間的相關(guān)性，去除信息冗余，對信息數(shù)據(jù)進行壓縮，那是十分必要的。[1，2]

為此，人們采用由輪廓、紋理定義的“區(qū)域”來表征視覺數(shù)據(jù)，這些區(qū)域?qū)?yīng)的是對象或?qū)ο蟮囊徊糠帧＿@種方法縮短了實際技術(shù)系統(tǒng)與人眼的視覺系統(tǒng)之間的距離，人眼視覺特性會強化某些視覺數(shù)據(jù)，而忽略某些對視覺效果無關(guān)緊要的信息。采樣、量化后得到的原始數(shù)據(jù)必須力求變換成符合人眼視覺特性的表征方式，一旦得到了這些區(qū)域，接下來就是將屬于同一視覺對象的各個區(qū)域連接起來。這種表征方式不僅可以實現(xiàn)對視頻數(shù)據(jù)的高效壓縮，也為實現(xiàn)基于對象、區(qū)域的一些新功能鋪平了道路。這種視頻編碼的概念已被廣泛接受，并且已經(jīng)成為新的圖像/視頻編碼標(biāo)準(zhǔn)——MPEG-4的基礎(chǔ)。

2、編碼結(jié)構(gòu)

在基于對象的視頻編碼中，編碼的基本單元是對象，基于對象的編碼主要是針對紋理、形狀、運動這三種信息的編碼技術(shù)。圖1所示的是可以對任意形狀的視頻對象進行編碼的通用框架。從圖1中可以看出，編碼框架中主要包括三個關(guān)鍵模塊，即形狀、運動和紋理編碼模塊。[2]

圖1 基于對象的信息編碼通用框架

總的說來，基于對象的視頻編碼過程可以分三步進行：

⑴ 從原始視頻流中采用全自動、半自動、人工等方法分割出視頻對象。

⑵ 對視頻對象進行編碼，對不同視頻對象的運動信息、形狀信息和紋理信息分配不同的碼字。

⑶ 對各個視頻對象的碼流進行復(fù)合。

3、結(jié)構(gòu)與語法

MPEG-4標(biāo)準(zhǔn)中定義的中心概念是AV對象（audio-visualobject）,這一概念是基于對象表征方法的基礎(chǔ)。MPEG-4的編碼機制是基于1616像素宏塊來設(shè)計的，不僅可以與現(xiàn)有的標(biāo)準(zhǔn)兼容，還便于對編碼進行更好的擴展。

MPEG-4的視頻碼流提供了對視頻場景的分層描述，如圖2所示。

分層的每一級都可以通過碼流中被稱為初始碼的特殊碼值進行訪問。用來描述場景的分層級為：

⒈ 視頻對象序列（VS，video objectsequence）：完整的MPEG-4場景，可以包括任何二維或三維自然和合成對象以及它們的增強層。

⒉ 視頻對象（VO，video object ）：一個視頻對象對應(yīng)著場景中的一個特定對象，可以是任意形狀的對象，也可以是一個矩形幀。

⒊ 視頻對象層（VOL，video object layer）：根據(jù)應(yīng)用的具體要求，每一個視頻對象都可以用分級或不分級的方式進行編碼，用視頻對象層來表征。VOL提供了對可分級編碼的支持。一個視頻對象可以用空間或時間分級來編碼，分辨率可以從粗糙到精細，譯碼端可以根據(jù)可用帶寬、計算功率、用戶需求等參數(shù)獲得期望的分辨率。視頻對象層包括：基本層和增強層?；緦涌梢杂卸鄠€，每一層表示一種分辨率。

⒋ 視頻對象平面組（GOV, group of video object planes）：GOV可以提供對碼流的隨機訪問點，GOV是任選的。

⒌ 視頻對象平面（VOP，video object plane）：一個VOP是對一個視頻對象的時間采樣，包括視頻對象的運動參數(shù)、形狀信息和紋理數(shù)據(jù)，對VOP編碼就是針對某一時刻該幀畫面VO的形狀、運動、紋理等信息進行編碼[3,4]。

圖2 MPEG-4的視頻碼流邏輯結(jié)構(gòu)圖

4、壓縮系統(tǒng)應(yīng)用設(shè)計

本系統(tǒng)通過MAP-CA為核心的處理器設(shè)計一個視頻頻壓縮系統(tǒng)的原理框圖如圖3所示。

MAP-CA寬帶信號處理器（BSP）。主要包含一個超長指令字處理器內(nèi)核（The VLIW core）、一個可編程位流協(xié)處理器（TheVLx）、視頻濾波協(xié)處理器、顯示刷新控制器和豐富的數(shù)字I/O接口等。MAP-CA支持各種用軟件實現(xiàn)的視頻、圖像以及信號的壓縮和解壓縮，這種軟件實現(xiàn)的算法相對硬件實現(xiàn)有很大的優(yōu)越性，升級非常方便。

MAP-CA的硬件接口包括視頻輸入輸出接口、音頻輸入輸出接口、PCI總線接口、SDRAM接口、顯示控制器接口、I2C接口、ROM控制器接口和標(biāo)準(zhǔn)的在線可編程JTAG接口等。

由于MAP-CA的強大功能，使其特別適合應(yīng)用于多媒體信號處理的各種產(chǎn)品當(dāng)中，如機頂盒、數(shù)字電視、視頻會議系統(tǒng)、醫(yī)用圖像產(chǎn)品、數(shù)字視頻編輯設(shè)備和辦公自動化產(chǎn)品等。此外，由于多媒體信號處理的核心工作都是基于MAP-CA/BSP-15的軟件平臺，因此我們可以方便地通過增加、刪除或者增強一些功能模塊來對我們的最終系統(tǒng)進行改進，具有高度的針對性、靈活性，所以MAP-CA/BSP-15是多媒體信號處理應(yīng)用的一個現(xiàn)成有效的解決方案。

系統(tǒng)的設(shè)計目標(biāo)：以MAP-CA為核心處理器設(shè)計一個視頻壓縮處理系統(tǒng)，該系統(tǒng)可插在標(biāo)準(zhǔn)PCI槽上，作為視頻壓縮卡，配以相應(yīng)的軟件可實時處理視頻信號：采集、壓縮、存盤及讀盤、解壓、輸出等。

實現(xiàn)的系統(tǒng)將輸入的模擬視頻信號經(jīng)過視頻編碼器進行模數(shù)轉(zhuǎn)換和數(shù)據(jù)格式處理后，得到標(biāo)準(zhǔn)的ITU-RBT.656格式的數(shù)字視頻流送給MAP-CA處理，實現(xiàn)視頻的MPEG-4壓縮處理。還可將壓縮后的數(shù)據(jù)解碼，并轉(zhuǎn)換為ITU-RBT.656格式輸出的視頻信號通過視頻編碼器進行數(shù)模轉(zhuǎn)換和格式變換，變成符合國際標(biāo)準(zhǔn)的NTSC/PAL制式的S-VIDEO電視信號的輸出。另外系統(tǒng)外接2MB的FLASH ROM存儲器作為系統(tǒng)的啟動電路和非易失存儲器；還接有64MB的PC133SDRAM內(nèi)存，作為系統(tǒng)程序運行和變量存儲的空間；通過PCI橋與PC機的PCI插槽直接相連，傳送到內(nèi)存中，不占用CPU資源。[5，6]

圖3 視頻壓縮系統(tǒng)的原理框圖

5、軟件開發(fā)介紹

MAP-CA可以完全用C語言編程，不需要任何低級語言。為此，Equator技術(shù)公司提供了一套名叫iMMediaTools的軟件開發(fā)包，其中包括一個優(yōu)化的并行C語言編譯器、FIRtree媒體本質(zhì)擴展C語言、匯編器、連接器、源代碼調(diào)試器、兩個虛擬機仿真器和分類的庫函數(shù)。

MAP-CA開發(fā)系統(tǒng)包括帶有FIRtree媒體本質(zhì)擴展 C語言的iMedialC編譯器。FIRtree是專門的單指令多數(shù)據(jù)流形式的高速媒體處理擴展語言。這個C編譯器運用了大量的優(yōu)化和全局配置技術(shù)，把涉及硬件的操作留給編譯器完成轉(zhuǎn)換，從而使編程人員不需要使用費時費力的匯編語言就可以完全發(fā)揮硬件的全部性能。

6、結(jié)論

本系統(tǒng)支持MPEG-4、I幀、IP幀等多種壓縮格式，壓縮質(zhì)量可調(diào)。在+/-256H，+/-256V的廣泛范圍內(nèi)，可以半幀的精度進行四倍運動估計。在極低碼率下傳輸，畫面質(zhì)量仍能取得滿意的效果。系統(tǒng)支持定碼流壓縮和動態(tài)碼流壓縮。前者在場景活動變化劇烈的情況下存儲容量不變，圖像質(zhì)量下降。后者質(zhì)量不變，而自動調(diào)節(jié)碼流。支持可變位速率自適應(yīng)記錄方式，通過動態(tài)偵測場景變化，自適應(yīng)調(diào)整碼流。通過靈活的碼率控制方式，可以自由設(shè)定定帶寬和定碼流的錄像和傳輸方式。帶寬和碼流任意可調(diào)。系統(tǒng)的具體技術(shù)指標(biāo)如表1所示

表1 可實現(xiàn)技術(shù)指標(biāo)

參考文獻

[1] 劉毓敏，數(shù)字視音頻技術(shù)與應(yīng)用 [M]，北京：電子工業(yè)出版社，2003，18～22
[2] 田棟，低速率視頻傳輸關(guān)鍵技術(shù)的研究 [D]，北京：北京工業(yè)大學(xué)，2001，8～12
[3] Zhong Yu ,Automatic caption localization in compressed video [J],IEEE Transcation on pattern anlysis and machine in telligence , 2000 ,22(4)：385～392
[4] 李楓，宋彥，戴禮榮，王任華，遠程多媒體監(jiān)控系統(tǒng)的軟硬件開發(fā) [J]，電子技術(shù)應(yīng)用，2000，26(12)，84～86
[5] S.Karthikeyan , A.Tamminneedi and E.K.F.lee.Design of Low-VoltageFront-End Interface for Switched-Opamp Circuits [J] , IEEE 115～119
[6] Mathieu.B，Melchior.P，Oustaloup.A，Ceyral.Ch. FractionalDifferentiation for Edge Detection[J]，SignalProcessing，2003，Vol.83：2421～2432

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

基于MPEG-4視頻圖像壓縮處理的研究與應(yīng)用

作者：仲叢久、張芝賢、關(guān)宗安 單位：沈陽航空工業(yè)學(xué)院電子信息工程學(xué)院 轉(zhuǎn)載：儀器儀表學(xué)報 發(fā)布時間：2009-01-05

作者：仲叢久、張芝賢、關(guān)宗安　　單位：沈陽航空工業(yè)學(xué)院電子信息工程學(xué)院　　轉(zhuǎn)載：儀器儀表學(xué)報　　發(fā)布時間：2009-01-05