杨幂魏大勋视频,无遮挡美女视频

JPEG2000綜述 [轉(zhuǎn)]

JPEG2000圖像壓縮標(biāo)準(zhǔn)及其關(guān)鍵算法

周寧    湯曉軍    徐維樸

(西安交通大學(xué)人工智能與機(jī)器人研究所西安710049)

    摘  要：JPEG2000是為適應(yīng)不斷發(fā)展的圖像壓縮應(yīng)用而出現(xiàn)的新的靜止圖像壓縮標(biāo)準(zhǔn)。闡述了JPEG2000圖像編碼系統(tǒng)的實(shí)現(xiàn)過(guò)程, 對(duì)其中采用的基本算法和關(guān)鍵技術(shù)進(jìn)行了描述，介紹了這一新標(biāo)準(zhǔn)的特點(diǎn)及應(yīng)用場(chǎng)合，并對(duì)其性能進(jìn)行了分析。
    關(guān)鍵詞：JPEG2000; 圖像壓縮；離散小波變換; 速率控制；感興趣區(qū)域

1  引言
    隨著多媒體應(yīng)用領(lǐng)域的快速增長(zhǎng)和網(wǎng)絡(luò)的不斷發(fā)展，傳統(tǒng)的JPEG壓縮技術(shù)已無(wú)法滿足人們對(duì)數(shù)字化多媒體圖像資料的要求，一種功能更強(qiáng)大、效率更卓越的靜止圖像壓縮標(biāo)準(zhǔn)被提到制定日程上，這就是JPEG2000。
        JPEG（Joint Photographic Experts Group）是在國(guó)際標(biāo)準(zhǔn)化組織(ISO)領(lǐng)導(dǎo)之下制定靜態(tài)圖像壓縮標(biāo)準(zhǔn)的委員會(huì)，第一套國(guó)際靜態(tài)圖像壓縮標(biāo)準(zhǔn)ISO 10918-1(JPEG)就是該委員會(huì)制定的。由于JPEG優(yōu)良的品質(zhì)，使他在短短幾年內(nèi)獲得了極大的成功，被廣泛應(yīng)用于互聯(lián)網(wǎng)和數(shù)碼相機(jī)領(lǐng)域，網(wǎng)站上80%的圖像都采用了JPEG壓縮標(biāo)準(zhǔn)。然而，目前的JPEG靜止圖像壓縮標(biāo)準(zhǔn),具有中端和高端比特速率上的良好的速率畸變特性，但在低比特率范圍內(nèi)，將會(huì)出現(xiàn)很明顯的方塊效應(yīng)，其質(zhì)量變得不可接受。JPEG不能在單一碼流中提供有損和無(wú)損壓縮，并且不能支持大于64×64 K的圖像壓縮。同時(shí)，盡管當(dāng)前的JPEG標(biāo)準(zhǔn)具有重新啟動(dòng)間隔的規(guī)定，但當(dāng)碰到比特差錯(cuò)時(shí)圖像質(zhì)量將受到嚴(yán)重的損壞。
    針對(duì)這些問(wèn)題，自1997年3月起，JPEG圖像壓縮標(biāo)準(zhǔn)委員會(huì)開(kāi)始著手制定新一代的圖像壓縮標(biāo)準(zhǔn)以解決上述問(wèn)題。2000年3月的東京會(huì)議，確定了彩色靜態(tài)圖像的新一代編碼方式JPEG2000圖像壓縮標(biāo)準(zhǔn)的編碼算法。
        JPEG2000系統(tǒng)分為下列7個(gè)部分：
    ①JPEG2000圖像編碼系統(tǒng)；
    ②擴(kuò)充(給①的核心定義添加更多的特征和完善度)；
    ③運(yùn)動(dòng)JPEG2000；
    ④一致性；
    ⑤參考軟件(目前包含Java和C實(shí)現(xiàn))；
    ⑥復(fù)合圖像文件格式(用于文件掃描和傳真應(yīng)用程序)；
    ⑦對(duì)①的最小支持(技術(shù)報(bào)告)。
    ①為完全被認(rèn)可的ISO標(biāo)準(zhǔn)，定義了核心壓縮技術(shù)和最小文件格式，②～⑥定義壓縮和文件格式的擴(kuò)充。其中，①已經(jīng)制定完成，其余部分還在制定過(guò)程中。本文所討論的JPEG2000標(biāo)準(zhǔn)就是基于第1部分的。
2  JPEG2000系統(tǒng)的特點(diǎn)
        JPEG2000以其特有的優(yōu)點(diǎn)彌補(bǔ)了現(xiàn)行JPEG標(biāo)準(zhǔn)的不足。離散小波變換算法中，圖像可以轉(zhuǎn)換成一系列可更加有效存儲(chǔ)像素模塊的子帶，因此，JPEG2000格式的圖像壓縮比可在現(xiàn)在的JPEG基礎(chǔ)上再提高10％～30％，而且壓縮后的圖像顯得更加細(xì)膩平滑。也就是說(shuō)，在網(wǎng)上觀看采用JPEG2000壓縮的圖像時(shí)，不僅下載速率比采用JPEG格式的快近30％，而且品質(zhì)也將更好。對(duì)于目前的JPEG標(biāo)準(zhǔn),在同一個(gè)壓縮碼流中不能同時(shí)提供有損和無(wú)損壓縮,而在JPEG2000系統(tǒng)中,通過(guò)選擇參數(shù), 能夠?qū)D像進(jìn)行有損和無(wú)損壓縮,可滿足圖像質(zhì)量要求很高的醫(yī)學(xué)圖像、圖像庫(kù)等方面的處理需要。現(xiàn)在網(wǎng)絡(luò)上的JPEG圖像下載時(shí)是按“塊”傳輸?shù)?，因此只能逐行地顯示，而采用JPEG2000格式的圖像支持漸進(jìn)傳輸(Progressive Transmission),這就允許圖像按照所需的分辨率或像素精度進(jìn)行重構(gòu),用戶根據(jù)需要,對(duì)圖像傳輸進(jìn)行控制,在獲得所需的圖像分辨率或質(zhì)量要求后,便可終止解碼,而不必接收整個(gè)圖像的壓縮碼流。由于JPEG2000采用小波技術(shù),利用其局部分辨特性,在不解壓的情況下,可隨機(jī)獲取某些感興趣的圖像區(qū)域（ROI）的壓縮碼流,對(duì)壓縮的圖像數(shù)據(jù)進(jìn)行傳輸、濾波等操作。
3  JPEG2000圖像編解碼系統(tǒng)
    本節(jié)主要介紹JPEG2000圖像編解碼系統(tǒng)。其編碼器和解碼器的框圖如圖1所示。

   在編碼器中，首先對(duì)源圖像進(jìn)行前期預(yù)處理，對(duì)處理的結(jié)果進(jìn)行離散小波變換，得到小波系數(shù)。然后對(duì)小波系數(shù)進(jìn)行量化和熵編碼，最后組成標(biāo)準(zhǔn)的輸出碼流（位流）。解碼器是編碼器的反過(guò)程，首先對(duì)碼流進(jìn)行解包和熵解碼，然后是反向量化和離散小波反變換，對(duì)反變換的結(jié)果進(jìn)行后期處理合成，就得到重構(gòu)的圖像數(shù)據(jù)。盡管JPEG2000編解碼過(guò)程與JPEG類似，但是對(duì)于每一步的具體實(shí)現(xiàn)兩者卻有非常大的差異。編碼過(guò)程的一般步驟如下：
    (1) 將有多個(gè)顏色分量組成的圖像分解成單一顏色分量的圖像。分量之間存在一定的相關(guān)性，通過(guò)分解相關(guān)的分量變換，可減少數(shù)據(jù)間的冗余度，提高壓縮效率；
    (2) 分量圖像被分解成大小統(tǒng)一的矩形片——圖像片。圖像片是進(jìn)行變換和編解碼的基本單元；
    (3) 每一個(gè)圖像片進(jìn)行小波變換。產(chǎn)生多級(jí)系數(shù)圖像。這些不同級(jí)數(shù)的系數(shù)圖像可以重構(gòu)出不同分辨率的圖像；
    (4) 多級(jí)分解的結(jié)果是由小波系數(shù)組成的多個(gè)子帶。他們表示圖像片中局部區(qū)域（而不是整幅圖像）的頻率特性；
    (5) 對(duì)系數(shù)子帶進(jìn)行量化，并且組成矩形數(shù)組的“碼塊”；
    (6) 對(duì)一個(gè)碼塊中的系數(shù)位平面（也就是一個(gè)碼塊中整個(gè)系數(shù)中具有同樣權(quán)值的那些位）進(jìn)行熵編碼；
    (7) 相對(duì)于圖像的背景區(qū)域，可以對(duì)感興趣區(qū)域進(jìn)行更高質(zhì)量的編碼；
    (8) 通過(guò)在位流中加入掩碼來(lái)增加抗干擾性；
    (9) 在每一個(gè)碼流的最前部都有一個(gè)頭結(jié)構(gòu)，他描述的是源圖像的屬性，各種分解情況和編碼風(fēng)格。這個(gè)頭結(jié)構(gòu)可以用來(lái)進(jìn)行定位、抽取、譯碼和重構(gòu)圖像，得到的圖像可以具有所期望的分辨率、重現(xiàn)精度、感興趣的區(qū)域或是其他特性。
    編碼過(guò)程主要分為以下幾個(gè)過(guò)程：預(yù)處理、核心處理和位流組織。預(yù)處理部分包括對(duì)圖像分片、直流電平（DC）位移和分量變換。核心處理部分由離散小波變換、量化和熵編碼組成。位流組織部分則包括區(qū)域劃分、碼塊、層和包的組織。
3.1  預(yù)處理
    (1)圖像分片
    分片指的是把源圖像分割成相互不重疊的矩形塊——圖像片，每一個(gè)圖像片作為一個(gè)獨(dú)立的圖像進(jìn)行壓縮編碼。編碼中的所有操作都是針對(duì)圖像片進(jìn)行的。圖像片是進(jìn)行變換和編解碼的基本單元。圖像的分片降低了對(duì)存儲(chǔ)空間的要求，并且由于他們重構(gòu)時(shí)也是獨(dú)立進(jìn)行的，所以可以用來(lái)對(duì)圖像的特定區(qū)域而不是整幅圖像進(jìn)行解碼。當(dāng)然，圖像分片會(huì)影響圖像質(zhì)量。比較小的圖像片會(huì)比大圖像片產(chǎn)生更大的失真。圖像分片在低比特率表示圖像的時(shí)候所造成的圖像失真會(huì)更加嚴(yán)重。
    (2)DC電平位移
    在對(duì)每一圖像片進(jìn)行正向離散小波變換之前，都要進(jìn)行直流電平位移。目的是在解碼時(shí)，能夠從有符號(hào)的數(shù)值中正確恢復(fù)重構(gòu)的無(wú)符號(hào)樣本值。直流電平位移是對(duì)僅有無(wú)符號(hào)數(shù)組成的圖像片的像素進(jìn)行的。電平位移并不影響圖像的質(zhì)量。在解碼端，在離散小波反變換之后，對(duì)重構(gòu)的圖像進(jìn)行反向直流電平位移。
    (3)分量變換
    JPEG2000支持多分量圖像。不同的分量不需要有相同的比特深度，也不需要都是無(wú)符號(hào)或有符號(hào)數(shù)。對(duì)于可恢復(fù)（無(wú)損）系統(tǒng)，唯一的要求就是每一個(gè)輸出分量圖像的比特深度必須跟相應(yīng)輸入分量圖像的比特深度保持一致。
3.2  核心處理
    (1)小波變換
    不同于傳統(tǒng)的DCT變換，小波變換具有對(duì)信號(hào)進(jìn)行多分辨率分析和反映信號(hào)局部特征的特點(diǎn)。通過(guò)對(duì)圖像片進(jìn)行離散小波變換，得到小波系數(shù)圖像，而分解的級(jí)數(shù)視具體情況而定。小波系數(shù)圖像由幾種子帶系數(shù)圖像組成。這些子帶系數(shù)圖像描述的是圖像片水平和垂直方向的空間頻率特性。不同子帶的小波系數(shù)反映圖像片不同空間分辨率的特性。通過(guò)多級(jí)小波分解，小波系數(shù)既能表示圖像片中局部區(qū)域的高頻信息（如圖像邊緣），也能表示圖像片中的低頻信息（如圖像背景）。這樣，即使在低比特律的情況下，我們也能保持較多的圖像細(xì)節(jié)（如邊緣）。另外，下一級(jí)分解得到的系數(shù)所表示圖像在水平和垂直方向的分辨率只有上一級(jí)小波系數(shù)所表示的圖像的一半。所以，通過(guò)對(duì)系數(shù)圖像的不同級(jí)數(shù)進(jìn)行解碼，就可以得到具有不同空間分辨率（或清晰，或模糊）的圖像。
    小波變換因其具有的這種優(yōu)點(diǎn)被JPEG2000標(biāo)準(zhǔn)所采用。在編碼系統(tǒng)中，對(duì)每個(gè)圖像片進(jìn)行Mallat塔式小波分解。經(jīng)過(guò)大量的測(cè)試，JPEG2000選用兩種小波濾波器：LeGall 5/3濾波器和Daubechies 9/7濾波器。前者可用于有損或無(wú)損圖像壓縮，后者只能用于有損壓縮。
    在JPEG2000標(biāo)準(zhǔn)中，小波濾波器可以有2種實(shí)現(xiàn)模式：基于卷積的和基于提升機(jī)制的。而具體實(shí)現(xiàn)時(shí)，對(duì)圖像邊緣都要進(jìn)行周期對(duì)稱延伸，這樣可以防止濾波器對(duì)圖像邊緣操作時(shí)產(chǎn)生失真。另外，為了減小變換時(shí)所需空間的開(kāi)銷，標(biāo)準(zhǔn)中還應(yīng)用了基于行的小波變換技術(shù)。
    (2)量化
    由于人類視覺(jué)系統(tǒng)對(duì)圖像的分辨率要求有一定的局限，通過(guò)適當(dāng)?shù)牧炕瘻p小變換系數(shù)的精度，可在不影響圖像主觀質(zhì)量的前提下，達(dá)到圖像壓縮的目的。量化的關(guān)鍵是根據(jù)變換后圖像的特征、重構(gòu)圖像質(zhì)量要求等因素設(shè)計(jì)合理的量化步長(zhǎng)。量化操作是有損的，會(huì)產(chǎn)生量化誤差。不過(guò)一種情況除外，那就是量化步長(zhǎng)是1，并且小波系數(shù)都是整數(shù)，利用可恢復(fù)整數(shù)5/3拍小波濾波器進(jìn)行小波變換得到的結(jié)果就符合這種情況。
    在JPEG2000標(biāo)準(zhǔn)中，對(duì)每一個(gè)子帶可以有不同的量化步長(zhǎng)。但是在一個(gè)子帶中只有一個(gè)量化步長(zhǎng)。量化以后，每一個(gè)小波系數(shù)有2部分來(lái)表示：符號(hào)和幅值。對(duì)量化后的小波系數(shù)進(jìn)行編碼。對(duì)于無(wú)損壓縮，量化步長(zhǎng)必須是1。
    (3)熵編碼
    圖像經(jīng)過(guò)變換、量化后，在一定程度上減少了空域和頻域上的冗余度，但是這些數(shù)據(jù)在統(tǒng)計(jì)意義上還存在一定的相關(guān)性，為此采用熵編碼來(lái)消除數(shù)據(jù)間的統(tǒng)計(jì)相關(guān)。將量化后的子帶系數(shù)劃分成小的矩形單元——碼塊（code block）。

   如圖2所示，采用兩層編碼策略，首先使用基于上下文的算術(shù)編碼器，每個(gè)碼塊進(jìn)行獨(dú)立的嵌入式碼塊編碼，得到碼塊的嵌入式壓縮位流。然后，根據(jù)率失真優(yōu)化原則，采用PCRD（Post Compression Rate Distortion）優(yōu)化算法思想，將所有碼塊的壓縮位流適當(dāng)截取，組織成具有不同質(zhì)量級(jí)的壓縮位流層。每一層上的壓縮位流連同其前面的所有層的壓縮位流，可重構(gòu)出一定質(zhì)量的圖像。在分層組織壓縮位流時(shí)，須對(duì)每個(gè)碼塊在每一層上的貢獻(xiàn)信息進(jìn)行編碼，即對(duì)碼塊位流在該層的截?cái)帱c(diǎn)信息等編碼。由于圖像采用小波變換，整個(gè)圖像壓縮碼流具有分辨率可分級(jí)性，從而，壓縮碼流可同時(shí)具有質(zhì)量上和分辨率上的可分級(jí)性。由于對(duì)碼塊進(jìn)行獨(dú)立編碼，因此，可根據(jù)需要，隨機(jī)獲取并解碼相應(yīng)的碼塊壓縮位流，重構(gòu)出所需的圖像區(qū)域。
    ①第一層編碼算法
    與傳統(tǒng)的依次對(duì)每個(gè)系數(shù)進(jìn)行算術(shù)熵編碼不同，JPEG2000編碼系統(tǒng)把碼塊中的量化系數(shù)組織成若干個(gè)位平面，從最高有效位平面（MSB）開(kāi)始，依次對(duì)每個(gè)位平面上的小波系數(shù)位進(jìn)行算術(shù)編碼。
    第一層編碼可以看作2部分：上下文的生成（CF）和算術(shù)編碼器（AE）。在上下文的生成中，以一定的順序掃描碼塊中的所有位。在碼塊的每個(gè)位平面上，從左上角系數(shù)開(kāi)始，從左到右，從上到下進(jìn)行掃描，并為每一位生成一個(gè)上下文。算術(shù)編碼器根據(jù)生成的上下文，對(duì)每一位進(jìn)行編碼。
    在量化后，小波系數(shù)被轉(zhuǎn)換為符號(hào)-振幅模式。在從MSB到LSB編碼時(shí)，當(dāng)遇到第一個(gè)為1的比特時(shí)，這個(gè)像素被稱作是顯著的，否則，為不顯著的。所有比特的上下文都是由他們的鄰域通過(guò)以下的4種方法產(chǎn)生：
    零編碼（zero coding，ZC）用來(lái)編碼非顯著像素在當(dāng)前的位平面中是否將變得顯著；
    游程編碼（run-length coding, RLC）用來(lái)編碼位于同一列中的4個(gè)非顯著性像素，如果他們的鄰域都是非顯著的；
    符號(hào)編碼（sign coding, SC）當(dāng)該位變得顯著后，編碼他的符號(hào)位；
    幅度編碼（Magnitude Refinement, MR）用來(lái)編碼顯著位。
    每個(gè)位平面都在3個(gè)編碼通道中進(jìn)行編碼。通道1是重要性傳播通道（Significance Propagation Pass），至少有一個(gè)重要性鄰域的像素，在此通道進(jìn)行編碼，使用ZC和SC。通道2是幅度細(xì)化通道（Magnitude Refinement Pass），所有的重要位在此通道進(jìn)行編碼，使用MR。通道3是清除通道（Cleanup Pass），所有沒(méi)有在上兩個(gè)通道中進(jìn)行編碼的像素，在此通道中進(jìn)行編碼，使用ZC,LRC和SC。位平面中的每一位在3個(gè)通道中進(jìn)行檢查來(lái)確定是否應(yīng)當(dāng)被編碼。
    由編碼通道得到的上下文和與其對(duì)應(yīng)的數(shù)據(jù)一起，送至算術(shù)編碼器進(jìn)行編碼。在這里，采用了自適應(yīng)二進(jìn)制算術(shù)編碼［1］，主要是考慮到計(jì)算的復(fù)雜度以及實(shí)現(xiàn)的方便性。在進(jìn)行算術(shù)編碼后，對(duì)每一個(gè)碼塊，得到一個(gè)獨(dú)立的嵌入式碼塊壓縮位流。
    ②第二層編碼算法
    在第二層編碼算法中，采用PCRD率失真優(yōu)化算法思想［1，2］，對(duì)所有碼塊的嵌入式壓縮位流進(jìn)行適當(dāng)?shù)慕厝。謱咏M織，形成整個(gè)圖像的具有質(zhì)量可分級(jí)的壓縮碼流。第二層編碼算法也可以看作兩部分：速率控制和分層組織壓縮位流。速率控制是指通過(guò)一定的編解碼措施，獲得給定壓縮碼率下的最佳重構(gòu)圖像質(zhì)量。分層組織壓縮位流根據(jù)編碼參數(shù)所規(guī)定的分層層數(shù)以及每一層的編碼速率，估算每一層的率失真門限，然后根據(jù)每一層估計(jì)出的率失真門限，按照碼塊率失真算法，找到每個(gè)碼塊嵌入式壓縮位流在該層上的截?cái)帱c(diǎn)，將截?cái)嗟拇a塊壓縮位流進(jìn)行打包，按照規(guī)定的格式存儲(chǔ)，形成圖像壓縮碼流。將碼流分層組織，每一層含有一定的質(zhì)量信息，在前面層的基礎(chǔ)上改善圖像質(zhì)量。這樣用戶可以根據(jù)自己的需要，控制圖像的傳輸，在取得滿意的圖像效果后，中止傳輸，在某種程度上緩解當(dāng)前網(wǎng)絡(luò)帶寬有限而圖像數(shù)據(jù)量大而造成的瓶頸問(wèn)題。
3.3  位流組織
    為了適合圖像交換，更好地應(yīng)用JPEG2000壓縮碼流的功能，JPEG2000標(biāo)準(zhǔn)規(guī)定了存放壓縮位流和解碼所需參數(shù)的格式，把壓縮碼流以包為單元進(jìn)行組織，形成最終的碼流。
4  JPEG2000中的關(guān)鍵技術(shù)
    在這一節(jié)中，對(duì)JPEG2000中所使用的關(guān)鍵技術(shù)加以說(shuō)明。
4.1 離散小波變換
    JPEG2000與傳統(tǒng)JPEG最大的不同在于他放棄了JPEG所采用的以離散余弦變換（DCT）為主的區(qū)塊編碼方式，轉(zhuǎn)而采用以小波變換（DWT）為主的多解析編碼方式。 
    余弦變換是經(jīng)典的譜分析工具，他考察的是整個(gè)時(shí)域過(guò)程的頻域特征或整個(gè)頻域過(guò)程的時(shí)域特征，因此對(duì)于平穩(wěn)過(guò)程，他有很好的效果，但對(duì)于非平穩(wěn)過(guò)程，他卻有諸多不足。在JPEG中，離散余弦變換將圖像壓縮為8×8 的小塊，然后依次放入文件中，這種算法靠丟棄頻率信息實(shí)現(xiàn)壓縮，因而圖像的壓縮率越高，頻率信息被丟棄的越多。在極端情況下，JPEG圖像只保留了反映圖像外貌的基本信息，精細(xì)的圖像細(xì)節(jié)都損失了。小波變換是現(xiàn)代譜分析工具，他既能考察局部時(shí)域過(guò)程的頻域特征，又能考察局部頻域過(guò)程的時(shí)域特征，因此即使對(duì)于非平穩(wěn)過(guò)程，處理起來(lái)也得心應(yīng)手。他能將圖像變換為一系列小波系數(shù)，這些系數(shù)可以被高效壓縮和存儲(chǔ)，此外，小波的粗略邊緣可以更好地表現(xiàn)圖像，因?yàn)樗薉CT壓縮普遍具有的方塊效應(yīng)。
4.2  速率控制算法
    JPEG2000通過(guò)采用速率控制方法來(lái)計(jì)算碼流的理想截?cái)帱c(diǎn)，從而獲得給定壓縮碼率下的最佳重構(gòu)圖像質(zhì)量。速率控制使用了PCRD率失真優(yōu)化算法。率失真優(yōu)化，即給定整個(gè)壓縮碼流的最大編碼速率，找出每個(gè)碼塊壓縮位流的適當(dāng)截?cái)帱c(diǎn)，在滿足的條件下，使重構(gòu)圖像失真最小。從而使得嵌入式碼塊編碼具有如下特點(diǎn)：生成的壓縮位流可根據(jù)需要，被截?cái)喑刹煌L(zhǎng)度的位流子集；將所有碼塊的截?cái)辔涣鹘M織起來(lái)，可重構(gòu)出一定質(zhì)量的圖像。
4.3  漸進(jìn)傳輸特性
    現(xiàn)在網(wǎng)絡(luò)上的JPEG圖像下載時(shí)是按“塊”傳輸?shù)?，因此只能逐行顯示，而采用JPEG2000格式的圖像支持漸進(jìn)傳輸。JPEG2000中的漸進(jìn)傳輸有2種，按照分辨率的漸進(jìn)傳輸和按照質(zhì)量的漸進(jìn)傳輸。按照質(zhì)量的漸進(jìn)傳輸就是先傳輸圖像輪廓數(shù)據(jù)，然后再逐步傳輸細(xì)節(jié)數(shù)據(jù)來(lái)不斷提高圖像質(zhì)量，而按照分辨率的漸進(jìn)傳輸則先傳輸分辨率較低的圖像，后一幅圖像在前一幅圖像的基礎(chǔ)上提高其分辨率。圖像的漸進(jìn)傳輸使得用戶不需要像以前那樣等圖像全部下載后才決定是否需要，有助于快速地瀏覽和選擇大量圖片，從而有效的解決了網(wǎng)絡(luò)傳輸?shù)钠款i問(wèn)題。
4.4  感興趣區(qū)域壓縮
    JPEG2000一個(gè)極其重要的優(yōu)點(diǎn)就是ROI（Region of Interest，感興趣區(qū)域）。用戶可以任意指定圖片上感興趣的區(qū)域，然后在壓縮時(shí)對(duì)這些區(qū)域指定壓縮質(zhì)量，或在恢復(fù)時(shí)指定某些區(qū)域的解壓縮要求。這是因?yàn)樽硬ㄔ诳臻g和頻率域上具有局域性，要完全恢復(fù)圖像中的某個(gè)局部，并不需要所有編碼都被精確保留，只要對(duì)應(yīng)他的一部分編碼沒(méi)有誤差就可以了。在實(shí)際應(yīng)用中，我們就可以對(duì)一幅圖像中感興趣的部分采用低壓縮比以獲取較好的圖像效果，而對(duì)其他部分采用高壓縮比以節(jié)省存儲(chǔ)空間。這樣就能在保證不丟失重要信息的同時(shí)又有效地壓縮了數(shù)據(jù)量，實(shí)現(xiàn)了真正的“交互式”壓縮。
5  JPEG2000標(biāo)準(zhǔn)的應(yīng)用
    隨著科技的發(fā)展，網(wǎng)絡(luò)已經(jīng)滲透到每個(gè)人的生活之中。然而，受到網(wǎng)絡(luò)帶寬的限制，高質(zhì)量的圖像由于數(shù)據(jù)量很大，在網(wǎng)絡(luò)上的傳輸延遲很大。因此，對(duì)于使用PC機(jī)、筆記本、掌上電腦或PDA,通過(guò)Modem接入因特網(wǎng)訪問(wèn)圖像數(shù)據(jù)的用戶來(lái)說(shuō)，允許根據(jù)需要選擇恰當(dāng)?shù)膱D像分辨率進(jìn)行瀏覽和傳輸是非常必要的。
    在軍事偵察和氣象預(yù)報(bào)中，由衛(wèi)星遙感得到的圖像必須通過(guò)遠(yuǎn)距離無(wú)線信道傳輸，傳輸誤碼的出現(xiàn)不可避免。JPEG2000編碼器特有的碼流組織形式是輸出碼流具有有效抑制誤碼的能力。這樣，碼流通過(guò)無(wú)線衛(wèi)星通訊信道發(fā)還給地面接收站后，地面接收站在解碼過(guò)程中可以利用JPEG2000內(nèi)部的碼流組織形式來(lái)避免由于傳輸誤碼而造成的錯(cuò)誤解碼。
    此外，在安全確認(rèn)、身份認(rèn)證及醫(yī)學(xué)領(lǐng)域，JPEG2000都有著其廣泛的應(yīng)用。可以預(yù)測(cè)，在不久的將來(lái)，JPEG2000將在以下領(lǐng)域得到廣泛的應(yīng)用：因特網(wǎng)、移動(dòng)和便攜設(shè)備、印刷、掃描（出版物預(yù)覽）、數(shù)碼相機(jī)、遙感、傳真（包括彩色傳真和因特網(wǎng)傳真）、醫(yī)學(xué)應(yīng)用、數(shù)字圖書館和電子商務(wù)等。
6  結(jié)論
    JPEG2000旨在創(chuàng)建一個(gè)新的圖像編碼系統(tǒng)，該壓縮編碼系統(tǒng)的率失真和主觀圖像質(zhì)量?jī)?yōu)于現(xiàn)有的JPEG標(biāo)準(zhǔn)，能夠提供對(duì)圖像的低碼率的壓縮，并且對(duì)壓縮碼流可進(jìn)行靈活的處理,如隨機(jī)獲取部分壓縮碼流、圖像的漸進(jìn)傳輸、感興趣區(qū)域的實(shí)現(xiàn)以及壓縮碼流較強(qiáng)的容錯(cuò)性能等,該標(biāo)準(zhǔn)將與現(xiàn)行JPEG標(biāo)準(zhǔn)兼容。JPEG2000圖像壓縮標(biāo)準(zhǔn)以其優(yōu)秀的性能，必將在數(shù)碼相機(jī)、遙感、傳真、醫(yī)療以及電子商務(wù)等多個(gè)領(lǐng)域得到廣泛的應(yīng)用，成為21世紀(jì)的主流靜態(tài)圖像壓縮標(biāo)準(zhǔn)。

參考文獻(xiàn)

［1］JPEG 2000 Image Coding ystem.JPEG 2000 Final Committee Draft Version 1.0, 2000，16(3)
［2］Taubman D. High Performance Scable Image Compression with EBCOT.IEEE Trans Image Processing,1994，3(9)：572～578
［3］張曉娣，等.新一代的靜止圖像壓縮標(biāo)準(zhǔn) JPEG2000.電信科學(xué)，2001(5)
［4］李冬梅.發(fā)展中的靜止圖像壓縮標(biāo)準(zhǔn)JPEG2000.電視技術(shù)，2001(6)
［5］王瑞軒.面向JPEG2000的二維DWT的VLSI設(shè)計(jì)與仿真，2002

xiaochongchong 發(fā)表于 >2005-1-17 20:15:19

[全文] [評(píng)論] [引用] [推薦] [檔案] [推給好友]

2005-1-7

考完試了

終于結(jié)束了研究生的第一學(xué)期的考試，感想頗多。
下學(xué)期要好好學(xué)習(xí)了。
剩下的時(shí)間做些jpeg2000相關(guān)的一些工作，然后就回家過(guò)年了……

xiaochongchong 發(fā)表于 >2005-1-7 23:42:18

[全文] [評(píng)論] [引用] [推薦] [檔案] [推給好友]

2005-1-2

新標(biāo)準(zhǔn)H264技術(shù)亮點(diǎn) [轉(zhuǎn)]

視頻編碼新標(biāo)準(zhǔn)H.264的技術(shù)亮點(diǎn)

　　摘要：
　　面向?qū)嶋H應(yīng)用，由ISO/IEC和ITU-T兩大國(guó)際標(biāo)準(zhǔn)化組織共同制定的H.264建議是視頻編碼技術(shù)的新發(fā)展。它在多模式運(yùn)動(dòng)估計(jì)、整數(shù)變換、統(tǒng)一VLC符號(hào)編碼、分層編碼語(yǔ)法等方面都有它的獨(dú)到之處。因此H.264算法具有很高的編碼效率，其應(yīng)用前景應(yīng)是不言而喻的。
　　關(guān)鍵詞：視頻編碼圖像通信 JVT
　　上個(gè)世紀(jì)80年代以來(lái)，ISO/IEC制定的MPEG-x和ITU-T制定的H.26x兩大系列視頻編碼國(guó)際標(biāo)準(zhǔn)的推出，開(kāi)創(chuàng)了視頻通信和存儲(chǔ)應(yīng)用的新紀(jì)元。從H.261視頻編碼建議，到H.262/3、MPEG-1/2/4等都有一個(gè)共同的不斷追求的目標(biāo)，即在盡可能低的碼率（或存儲(chǔ)容量）下獲得盡可能好的圖像質(zhì)量。而且，隨著市場(chǎng)對(duì)圖像傳輸需求的增加，如何適應(yīng)不同信道傳輸特性的問(wèn)題也日益顯現(xiàn)出來(lái)。這就是IEO/IEC和ITU-T兩大國(guó)際標(biāo)準(zhǔn)化組織聯(lián)手制定的視頻新標(biāo)準(zhǔn)H.264所要解決的問(wèn)題。
　　H.261是最早出現(xiàn)的視頻編碼建議，目的是規(guī)范ISDN網(wǎng)上的會(huì)議電視和可視電話應(yīng)用中的視頻編碼技術(shù)。它采用的算法結(jié)合了可減少時(shí)間冗余的幀間預(yù)測(cè)和可減少空間冗余的DCT變換的混合編碼方法。和ISDN信道相匹配，其輸出碼率是p×64kbit/s。p取值較小時(shí)，只能傳清晰度不太高的圖像，適合于面對(duì)面的電視電話；p取值較大時(shí)（如 p＞6），可以傳輸清晰度較好的會(huì)議電視圖像。H.263 建議的是低碼率圖像壓縮標(biāo)準(zhǔn)，在技術(shù)上是H.261的改進(jìn)和擴(kuò)充，支持碼率小于64kbit/s的應(yīng)用。但實(shí)質(zhì)上H.263以及后來(lái)的H.263+和H.263++已發(fā)展成支持全碼率應(yīng)用的建議，從它支持眾多的圖像格式這一點(diǎn)就可看出，如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
　　MPEG-1標(biāo)準(zhǔn)的碼率為1.2Mbit/s左右，可提供30幀CIF（352×288）質(zhì)量的圖像，是為CD-ROM光盤的視頻存儲(chǔ)和播放所制定的。MPEG-l標(biāo)準(zhǔn)視頻編碼部分的基本算法與H.261/H.263相似，也采用運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)、二維DCT、VLC游程編碼等措施。此外還引入了幀內(nèi)幀（I）、預(yù)測(cè)幀（P）、雙向預(yù)測(cè)幀（B）和直流幀（D）等概念，進(jìn)一步提高了編碼效率。在MPEG-1的基礎(chǔ)上，MPEG-2標(biāo)準(zhǔn)在提高圖像分辨率、兼容數(shù)字電視等方面做了一些改進(jìn)，例如它的運(yùn)動(dòng)矢量的精度為半像素；在編碼運(yùn)算中（如運(yùn)動(dòng)估計(jì)和DCT）區(qū)分“幀”和“場(chǎng)”；引入了編碼的可分級(jí)性技術(shù)，如空間可分級(jí)性、時(shí)間可分級(jí)性和信噪比可分級(jí)性等。近年推出的MPEG-4標(biāo)準(zhǔn)引入了基于視聽(tīng)對(duì)象（AVO：Audio-Visual Object）的編碼，大大提高了視頻通信的交互能力和編碼效率。MPEG-4中還采用了一些新的技術(shù)，如形狀編碼、自適應(yīng)DCT、任意形狀視頻對(duì)象編碼等。但是MPEG-4的基本視頻編碼器還是屬于和H.263相似的一類混合編碼器。
　　總之，H.261建議是視頻編碼的經(jīng)典之作，H.263是其發(fā)展，并將逐步在實(shí)際上取而代之，主要應(yīng)用于通信方面，但H.263眾多的選項(xiàng)往往令使用者無(wú)所適從。MPEG系列標(biāo)準(zhǔn)從針對(duì)存儲(chǔ)媒體的應(yīng)用發(fā)展到適應(yīng)傳輸媒體的應(yīng)用，其核心視頻編碼的基本框架是和H.261一致的，其中引人注目的MPEG-4的“基于對(duì)象的編碼”部分由于尚有技術(shù)障礙，目前還難以普遍應(yīng)用。因此，在此基礎(chǔ)上發(fā)展起來(lái)的新的視頻編碼建議H.264克服了兩者的弱點(diǎn)，在混合編碼的框架下引入了新的編碼方式，提高了編碼效率，面向?qū)嶋H應(yīng)用。同時(shí)，它是兩大國(guó)際標(biāo)準(zhǔn)化組織的共同制定的，其應(yīng)用前景應(yīng)是不言而喻的。
　　一、JVT的H.264
　　H.264是ITU-T的VCEG（視頻編碼專家組）和ISO/IEC的MPEG（活動(dòng)圖像編碼專家組）的聯(lián)合視頻組（JVT：joint video team）開(kāi)發(fā)的一個(gè)新的數(shù)字視頻編碼標(biāo)準(zhǔn)，它既是ITU-T的H.264，又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開(kāi)始草案征集，1999年9月，完成第一個(gè)草案，2001年5月制定了其測(cè)試模式TML-8，2002年6月的 JVT第5次會(huì)議通過(guò)了H.264的FCD板。目前該標(biāo)準(zhǔn)還在開(kāi)發(fā)之中，預(yù)計(jì)明年上半年可正式通過(guò)。
　　H.264和以前的標(biāo)準(zhǔn)一樣，也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡(jiǎn)潔設(shè)計(jì)，不用眾多的選項(xiàng)，獲得比H.263++好得多的壓縮性能；加強(qiáng)了對(duì)各種信道的適應(yīng)能力，采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語(yǔ)法，有利于對(duì)誤碼和丟包的處理；應(yīng)用目標(biāo)范圍較寬，以滿足不同速率、不同解析度以及不同傳輸（存儲(chǔ)）場(chǎng)合的需求；它的基本系統(tǒng)是開(kāi)放的，使用無(wú)需版權(quán)。
　　在技術(shù)上，H.264標(biāo)準(zhǔn)中有多個(gè)閃光之處，如統(tǒng)一的VLC符號(hào)編碼，高精度、多模式的位移估計(jì)，基于4×4塊的整數(shù)變換、分層的編碼語(yǔ)法等。這些措施使得H.264算法具有很的高編碼效率，在相同的重建圖像質(zhì)量下，能夠比H.263節(jié)約50％左右的碼率。H.264的碼流結(jié)構(gòu)網(wǎng)絡(luò)適應(yīng)性強(qiáng)，增加了差錯(cuò)恢復(fù)能力，能夠很好地適應(yīng)IP和無(wú)線網(wǎng)絡(luò)的應(yīng)用。
　　二、H264的技術(shù)亮點(diǎn)
　　分層設(shè)計(jì)
　　H.264的算法在概念上可以分為兩層：視頻編碼層（VCL：Video Coding Layer）負(fù)責(zé)高效的視頻內(nèi)容表示，網(wǎng)絡(luò)提取層（NAL：Network Abstraction Layer）負(fù)責(zé)以網(wǎng)絡(luò)所要求的恰當(dāng)?shù)姆绞綄?duì)數(shù)據(jù)進(jìn)行打包和傳送。H.264編碼器分層結(jié)構(gòu)如圖1所示。在VCL和NAL之間定義了一個(gè)基于分組方式的接口，打包和相應(yīng)的信令屬于NAL的一部分。這樣，高編碼效率和網(wǎng)絡(luò)友好性的任務(wù)分別由VCL和NAL來(lái)完成。
　　VCL層包括基于塊的運(yùn)動(dòng)補(bǔ)償混合編碼和一些新特性。與前面的視頻編碼標(biāo)準(zhǔn)一樣，H.264沒(méi)有把前處理和后處理等功能包括在草案中，這樣可以增加標(biāo)準(zhǔn)的靈活性。
　　NAL負(fù)責(zé)使用下層網(wǎng)絡(luò)的分段格式來(lái)封裝數(shù)據(jù)，包括組幀、邏輯信道的信令、定時(shí)信息的利用或序列結(jié)束信號(hào)等。例如，NAL支持視頻在電路交換信道上的傳輸格式，支持視頻在Internet上利用　　　　　RTP/UDP/IP傳輸?shù)母袷健AL包括自己的頭部信息、段結(jié)構(gòu)信息和實(shí)際載荷信息，即上層的VCL數(shù)據(jù)。（如果采用數(shù)據(jù)分割技術(shù)，數(shù)據(jù)可能由幾個(gè)部分組成）。
　　高精度、多模式運(yùn)動(dòng)估計(jì)
　　H.264支持1/4或1/8像素精度的運(yùn)動(dòng)矢量。在1/4像素精度時(shí)可使用6抽頭濾波器來(lái)減少高頻噪聲，對(duì)于1/8像素精度的運(yùn)動(dòng)矢量，可使用更為復(fù)雜的8抽頭的濾波器。在進(jìn)行運(yùn)動(dòng)估計(jì)時(shí)，編碼器還可選擇“增強(qiáng)”內(nèi)插濾波器來(lái)提高預(yù)測(cè)的效果。
　　在H.264的運(yùn)動(dòng)預(yù)測(cè)中，一個(gè)宏塊（MB）可以按圖2被分為不同的子塊，形成7種不同模式的塊尺寸。這種多模式的靈活和細(xì)致的劃分，更切合圖像中實(shí)際運(yùn)動(dòng)物體的形狀，大大提高了運(yùn)動(dòng)估計(jì)的精確程度。在這種方式下，在每個(gè)宏塊中可以包含有1、2、4、8或16個(gè)運(yùn)動(dòng)矢量。
　　在H.264中，允許編碼器使用多于一幀的先前幀用于運(yùn)動(dòng)估計(jì)，這就是所謂的多幀參考技術(shù)。例如2幀或3幀剛剛編碼好的參考幀，編碼器將選擇對(duì)每個(gè)目標(biāo)宏塊能給出更好的預(yù)測(cè)幀，并為每一宏塊指示是哪一幀被用于預(yù)測(cè)。
　　4×4塊的整數(shù)變換
　　H.264與先前的標(biāo)準(zhǔn)相似，對(duì)殘差采用基于塊的變換編碼，但變換是整數(shù)操作而不是實(shí)數(shù)運(yùn)算，其過(guò)程和DCT基本相似。這種方法的優(yōu)點(diǎn)在于：在編碼器中和解碼器中允許精度相同的變換和反變換，便于使用簡(jiǎn)單的定點(diǎn)運(yùn)算方式。也就是說(shuō)，這里沒(méi)有“反變換誤差”。變換的單位是4×4塊，而不是以往常用的8×8塊。由于用于變換塊的尺寸縮小，運(yùn)動(dòng)物體的劃分更精確，這樣，不但變換計(jì)算量比較小，而且在運(yùn)動(dòng)物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對(duì)圖像中較大面積的平滑區(qū)域不產(chǎn)生塊之間的灰度差異，可對(duì)幀內(nèi)宏塊亮度數(shù)據(jù)的16個(gè)4×4塊的DC系數(shù)（每個(gè)小塊一個(gè)，共16個(gè)）進(jìn)行第二次4×4塊的變換，對(duì)色度數(shù)據(jù)的4個(gè)4×4塊的DC系數(shù)（每個(gè)小塊一個(gè)，共4個(gè)）進(jìn)行2×2塊的變換。
　　H.264為了提高碼率控制的能力，量化步長(zhǎng)的變化的幅度控制在12.5%左右，而不是以不變的增幅變化。變換系數(shù)幅度的歸一化被放在反量化過(guò)程中處理以減少計(jì)算的復(fù)雜性。為了強(qiáng)調(diào)彩色的逼真性，對(duì)色度系數(shù)采用了較小量化步長(zhǎng)。
　　統(tǒng)一的VLC
　　H.264中熵編碼有兩種方法，一種是對(duì)所有的待編碼的符號(hào)采用統(tǒng)一的VLC（UVLC ：Universal VLC），另一種是采用內(nèi)容自適應(yīng)的二進(jìn)制算術(shù)編碼（CABAC：Context-Adaptive Binary Arithmetic Coding）。CABAC是可選項(xiàng)，其編碼性能比UVLC稍好，但計(jì)算復(fù)雜度也高。UVLC使用一個(gè)長(zhǎng)度無(wú)限的碼字集，設(shè)計(jì)結(jié)構(gòu)非常有規(guī)則，用相同的碼表可以對(duì)不同的對(duì)象進(jìn)行編碼。這種方法很容易產(chǎn)生一個(gè)碼字，而解碼器也很容易地識(shí)別碼字的前綴，UVLC在發(fā)生比特錯(cuò)誤時(shí)能快速獲得重同步。
　　這里，x0，x1，x2，…是INFO比特，并且為0或1。圖4列出了前9種碼字。如：第4號(hào)碼字包含INFO01，這一碼字的設(shè)計(jì)是為快速再同步而經(jīng)過(guò)優(yōu)化的，以防止誤碼。
　　幀內(nèi)預(yù)測(cè)
　　在先前的H.26x系列和MPEG-x系列標(biāo)準(zhǔn)中，都是采用的幀間預(yù)測(cè)的方式。在H.264中，當(dāng)編碼Intra圖像時(shí)可用幀內(nèi)預(yù)測(cè)。對(duì)于每個(gè)4×4塊（除了邊緣塊特別處置以外），每個(gè)像素都可用17個(gè)最接近的先前已編碼的像素的不同加權(quán)和（有的權(quán)值可為0）來(lái)預(yù)測(cè)，即此像素所在塊的左上角的17個(gè)像素。顯然，這種幀內(nèi)預(yù)測(cè)不是在時(shí)間上，而是在空間域上進(jìn)行的預(yù)測(cè)編碼算法，可以除去相鄰塊之間的空間冗余度，取得更為有效的壓縮。
　　4×4方塊中a、b、...、p為16 個(gè)待預(yù)測(cè)的像素點(diǎn)，而A、B、...、P是已編碼的像素。如m點(diǎn)的值可以由（J＋2K＋L＋2）/ 4 式來(lái)預(yù)測(cè)，也可以由（A+B+C+D+I+J+K+L）/ 8 式來(lái)預(yù)測(cè)，等等。按照所選取的預(yù)測(cè)參考的點(diǎn)不同，亮度共有9類不同的模式，但色度的幀內(nèi)預(yù)測(cè)只有1類模式。
　　面向IP和無(wú)線環(huán)境
　　H.264 草案中包含了用于差錯(cuò)消除的工具，便于壓縮視頻在誤碼、丟包多發(fā)環(huán)境中傳輸，如移動(dòng)信道或IP信道中傳輸?shù)慕研浴?br>　　為了抵御傳輸差錯(cuò)，H.264視頻流中的時(shí)間同步可以通過(guò)采用幀內(nèi)圖像刷新來(lái)完成，空間同步由條結(jié)構(gòu)編碼（slice structured coding）來(lái)支持。同時(shí)為了便于誤碼以后的再同步，在一幅圖像的視頻數(shù)據(jù)中還提供了一定的重同步點(diǎn)。另外，幀內(nèi)宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時(shí)候不僅可以考慮編碼效率，還可以考慮傳輸信道的特性。
　　除了利用量化步長(zhǎng)的改變來(lái)適應(yīng)信道碼率外，在H.264中，還常利用數(shù)據(jù)分割的方法來(lái)應(yīng)對(duì)信道碼率的變化。從總體上說(shuō)，數(shù)據(jù)分割的概念就是在編碼器中生成具有不同優(yōu)先級(jí)的視頻數(shù)據(jù)以支持網(wǎng)絡(luò)中的服務(wù)質(zhì)量QoS。例如采用基于語(yǔ)法的數(shù)據(jù)分割（syntax-based data partitioning）方法，將每幀數(shù)據(jù)的按其重要性分為幾部分，這樣允許在緩沖區(qū)溢出時(shí)丟棄不太重要的信息。還可以采用類似的時(shí)間數(shù)據(jù)分割（temporal data partitioning）方法，通過(guò)在P幀和B幀中使用多個(gè)參考幀來(lái)完成。
　　在無(wú)線通信的應(yīng)用中，我們可以通過(guò)改變每一幀的量化精度或空間/時(shí)間分辨率來(lái)支持無(wú)線信道的大比特率變化。可是，在多播的情況下，要求編碼器對(duì)變化的各種比特率進(jìn)行響應(yīng)是不可能的。因此，不同于MPEG-4中采用的精細(xì)分級(jí)編碼FGS（Fine Granular Scalability）的方法（效率比較低），H.264采用流切換的SP幀來(lái)代替分級(jí)編碼。
　　三、TML-8性能
　　TML-8為H.264的測(cè)試模式，用它來(lái)對(duì)H.264的視頻編碼效率進(jìn)行比較和測(cè)試。測(cè)試結(jié)果所提供的PSNR已清楚地表明，相對(duì)于MPEG-4（ASP：Advanced Simple Profile）和H.263++（HLP：High Latency Profile）的性能，H.264的結(jié)果具有明顯的優(yōu)越性，如圖5所示。
　　H.264的PSNR比MPEG-4（ASP）和H.263++（HLP）明顯要好，在6種速率的對(duì)比測(cè)試中，H.264的PSNR比MPEG-4（ASP）平均要高2dB，比H.263（HLP）平均要高3dB。6個(gè)測(cè)試速率及其相關(guān)的條件分別為：32 kbit/s速率、10f/s幀率和QCIF格式；64 kbit/s速率、15f/s幀率和QCIF格式；128kbit/s速率、15f/s幀率和CIF格式；256kbit/s速率、15f/s幀率和QCIF格式；512 kbit/s速率、30f/s幀率和CIF格式；1024 kbit/s速率、30f/s幀率和CIF格式。
　　四、實(shí)現(xiàn)難度
　　對(duì)每個(gè)考慮實(shí)際應(yīng)用的工程師而言，在關(guān)注H.264的優(yōu)越性能的同時(shí)必然會(huì)衡量其實(shí)現(xiàn)難度。從總體上說(shuō)，H.264性能的改進(jìn)是以增加復(fù)雜性為代價(jià)而獲得的。但是，隨著技術(shù)的發(fā)展，這種復(fù)雜性的增加是在我們當(dāng)前或不久的將來(lái)的技術(shù)可接受的范圍之內(nèi)的。實(shí)際上，考慮到復(fù)雜性的限制，H.264對(duì)一些計(jì)算量特別大的改進(jìn)算法未予采用，如H.264未采用全局運(yùn)動(dòng)補(bǔ)技術(shù)，這在MPEG-4的ASP中是采用的，并增加了相當(dāng)?shù)木幋a復(fù)雜性。
　　H.264和MPEG-4兩者都包括了B幀和比MPEG-2、H.263或MPEG-4的SP（Simple profile）更為精確、更為復(fù)雜的運(yùn)動(dòng)內(nèi)插濾波。為了更好地完成運(yùn)動(dòng)估計(jì)，H.264顯著地增加了可變塊尺寸的種類和可變參考幀的數(shù)目。
　　H.264的RAM需求主要用于參考幀圖像，大多數(shù)編碼視頻使用3～5幀參考圖像。它對(duì)ROM的需求并不比通常的視頻編碼器更多，因?yàn)镠.264的UVLC對(duì)所有的各類數(shù)據(jù)采用了一個(gè)結(jié)構(gòu)良好的查找表。
　　五、結(jié)束語(yǔ)
　　H.264具有廣闊的應(yīng)用前景，例如實(shí)時(shí)視頻通信、因特網(wǎng)視頻傳輸、視頻流媒體服務(wù)、異構(gòu)網(wǎng)上的多點(diǎn)通信、壓縮視頻存儲(chǔ)、視頻數(shù)據(jù)庫(kù)等。
　　H.264建議的技術(shù)特點(diǎn)可以歸納為三個(gè)方面，一是注重實(shí)用，采用成熟的技術(shù)，追求更高的編碼效率，簡(jiǎn)潔的表現(xiàn)形式；二是注重對(duì)移動(dòng)和IP網(wǎng)絡(luò)的適應(yīng)，采用分層技術(shù)，從形式上將編碼和信道隔離開(kāi)來(lái)，實(shí)質(zhì)上是在源編碼器算法中更多地考慮到信道的特點(diǎn)；三是在混合編碼器的基本框架下，對(duì)其主要關(guān)鍵部件都做了重大改進(jìn)，如多模式運(yùn)動(dòng)估計(jì)、幀內(nèi)預(yù)測(cè)、多幀預(yù)測(cè)、統(tǒng)一VLC、4×4二維整數(shù)變換等。
　　迄今為止，H.264尚未最后定稿，但因其更高的壓縮比，更好的信道適應(yīng)性，必將在數(shù)字視頻的通信或存儲(chǔ)領(lǐng)域得到越來(lái)越廣泛的應(yīng)用，其發(fā)展?jié)摿Σ豢上蘖俊?br>　　最后，必須說(shuō)明的是，H.264優(yōu)越性能的獲得不是沒(méi)有代價(jià)的，其代價(jià)是計(jì)算復(fù)雜度的大大增加，據(jù)估計(jì)，編碼的計(jì)算復(fù)雜度大約相當(dāng)于H.263的3倍，解碼復(fù)雜度大約相當(dāng)于H.263的2倍。

xiaochongchong 發(fā)表于 >2005-1-2 11:32:09

[全文] [評(píng)論] [引用] [推薦] [檔案] [推給好友]

2005-1-2

視頻編碼標(biāo)準(zhǔn)的發(fā)展:從H.261到H.264 [轉(zhuǎn)]

　　數(shù)字視頻技術(shù)廣泛應(yīng)用于通信、計(jì)算機(jī)、廣播電視等領(lǐng)域，帶來(lái)了會(huì)議電視、可視電話及數(shù)字電視、媒體存儲(chǔ)等一系列應(yīng)用，促使了許多視頻編碼標(biāo)準(zhǔn)的產(chǎn)生。ITU-T與ISO/IEC是制定視頻編碼標(biāo)準(zhǔn)的兩大組織，ITU-T的標(biāo)準(zhǔn)包括H.261、H.263、H.264，主要應(yīng)用于實(shí)時(shí)視頻通信領(lǐng)域，如會(huì)議電視；MPEG系列標(biāo)準(zhǔn)是由ISO/IEC制定的，主要應(yīng)用于視頻存儲(chǔ)(DVD)、廣播電視、因特網(wǎng)或無(wú)線網(wǎng)上的流媒體等。兩個(gè)組織也共同制定了一些標(biāo)準(zhǔn)，H.262標(biāo)準(zhǔn)等同于MPEG-2的視頻編碼標(biāo)準(zhǔn)，而最新的H.264標(biāo)準(zhǔn)則被納入MPEG-4的第10部分。

　　本文按照ITU-T視頻編碼標(biāo)準(zhǔn)的發(fā)展過(guò)程，介紹H.261、H.263及H.264。

H.261視頻編碼標(biāo)準(zhǔn)

　　H.261是ITU-T為在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上開(kāi)展雙向聲像業(yè)務(wù)(可視電話、視頻會(huì)議)而制定的，速率為64kb/s的整數(shù)倍。H.261只對(duì)CIF和QCIF兩種圖像格式進(jìn)行處理，每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來(lái)處理。

　　H.261是最早的運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)，它詳細(xì)制定了視頻編碼的各個(gè)部分，包括運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)、DCT變換、量化、熵編碼，以及與固定速率的信道相適配的速率控制等部分。

H.263視頻編碼標(biāo)準(zhǔn)

　　H.263是最早用于低碼率視頻編碼的ITU-T標(biāo)準(zhǔn)，隨后出現(xiàn)的第二版(H.263+)及H.263++增加了許多選項(xiàng)，使其具有更廣泛的適用性。

H.263視頻壓縮標(biāo)準(zhǔn)

　　H.263是ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標(biāo)準(zhǔn)。它是在H.261基礎(chǔ)上發(fā)展起來(lái)的，其標(biāo)準(zhǔn)輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。H.263與H.261相比采用了半象素的運(yùn)動(dòng)補(bǔ)償，并增加了4種有效的壓縮編碼模式。

　　無(wú)限制的運(yùn)動(dòng)矢量模式允許運(yùn)動(dòng)矢量指向圖像以外的區(qū)域。當(dāng)某一運(yùn)動(dòng)矢量所指的參考宏塊位于編碼圖像之外時(shí)，就用其邊緣的圖像象素值來(lái)代替。當(dāng)存在跨邊界的運(yùn)動(dòng)時(shí)，這種模式能取得很大的編碼增益，特別是對(duì)小圖像而言。另外，這種模式包括了運(yùn)動(dòng)矢量范圍的擴(kuò)展，允許使用更大的運(yùn)動(dòng)矢量，這對(duì)攝像機(jī)運(yùn)動(dòng)特別有利。

　　基于句法的算術(shù)編碼模式使用算術(shù)編碼代替霍夫曼編碼，可在信噪比和重建圖像質(zhì)量相同的情況下降低碼率。

　　先進(jìn)的預(yù)測(cè)模式允許一個(gè)宏塊中4個(gè)8×8亮度塊各對(duì)應(yīng)一個(gè)運(yùn)動(dòng)矢量，從而提高了預(yù)測(cè)精度；兩個(gè)色度塊的運(yùn)動(dòng)矢量則取這4個(gè)亮度塊運(yùn)動(dòng)矢量的平均值。補(bǔ)償時(shí)，使用重疊的塊運(yùn)動(dòng)補(bǔ)償，8×8亮度塊的每個(gè)象素的補(bǔ)償值由3個(gè)預(yù)測(cè)值加權(quán)平均得到。使用該模式可以產(chǎn)生顯著的編碼增益，特別是采用重疊的塊運(yùn)動(dòng)補(bǔ)償，會(huì)減少塊效應(yīng)，提高主觀質(zhì)量。

　　PB-幀模式規(guī)定一個(gè)PB-幀包含作為一個(gè)單元進(jìn)行編碼的兩幀圖像。PB-幀模式可在碼率增加不多的情況下，使幀率加倍。

H.263視頻壓縮標(biāo)準(zhǔn)版本2

　　ITU-T在H.263發(fā)布后又修訂發(fā)布了H.263標(biāo)準(zhǔn)的版本2，非正式地命名為H.263+標(biāo)準(zhǔn)。它在保證原H.263標(biāo)準(zhǔn)核心句法和語(yǔ)義不變的基礎(chǔ)上，增加了若干選項(xiàng)以提高壓縮效率或改善某方面的功能。原H.263標(biāo)準(zhǔn)限制了其應(yīng)用的圖像輸入格式，僅允許5種視頻源格式。H.263+標(biāo)準(zhǔn)允許更大范圍的圖像輸入格式，自定義圖像的尺寸，從而拓寬了標(biāo)準(zhǔn)使用的范圍，使之可以處理基于視窗的計(jì)算機(jī)圖像、更高幀頻的圖像序列及寬屏圖像。

　　為提高壓縮效率，H.263+采用先進(jìn)的幀內(nèi)編碼模式；增強(qiáng)的PB-幀模式改進(jìn)了H.263的不足，增強(qiáng)了幀間預(yù)測(cè)的效果；去塊效應(yīng)濾波器不僅提高了壓縮效率，而且提供重建圖像的主觀質(zhì)量。

　　為適應(yīng)網(wǎng)絡(luò)傳輸，H.263+增加了時(shí)間分級(jí)、信噪比和空間分級(jí)，對(duì)在噪聲信道和存在大量包丟失的網(wǎng)絡(luò)中傳送視頻信號(hào)很有意義；另外，片結(jié)構(gòu)模式、參考幀選擇模式增強(qiáng)了視頻傳輸?shù)目拐`碼能力。

H.263++視頻壓縮標(biāo)準(zhǔn)

　　H263++在H263+基礎(chǔ)上增加了3個(gè)選項(xiàng)，主要是為了增強(qiáng)碼流在惡劣信道上的抗誤碼性能，同時(shí)為了提高增強(qiáng)編碼效率。這3個(gè)選項(xiàng)為：

　　選項(xiàng)U——稱為增強(qiáng)型參考幀選擇，它能夠提供增強(qiáng)的編碼效率和信道錯(cuò)誤再生能力(特別是在包丟失的情形下)，需要設(shè)計(jì)多緩沖區(qū)用于存貯多參考幀圖像。

　　選項(xiàng)V——稱為數(shù)據(jù)分片，它能夠提供增強(qiáng)型的抗誤碼能力(特別是在傳輸過(guò)程中本地?cái)?shù)據(jù)被破壞的情況下)，通過(guò)分離視頻碼流中DCT的系數(shù)頭和運(yùn)動(dòng)矢量數(shù)據(jù)，采用可逆編碼方式保護(hù)運(yùn)動(dòng)矢量。

　　選項(xiàng)W——在H263+的碼流中增加補(bǔ)充信息，保證增強(qiáng)型的反向兼容性，附加信息包括：指示采用的定點(diǎn)IDCT、圖像信息和信息類型、任意的二進(jìn)制數(shù)據(jù)、文本、重復(fù)的圖像頭、交替的場(chǎng)指示、稀疏的參考幀識(shí)別。 H.264視頻編碼標(biāo)準(zhǔn)

　　H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)。事實(shí)上，H.264標(biāo)準(zhǔn)的開(kāi)展可以追溯到8年前。1996年制定H.263標(biāo)準(zhǔn)后，ITU-T的視頻編碼專家組(VCEG)開(kāi)始了兩個(gè)方面的研究：一個(gè)是短期研究計(jì)劃，在H.263基礎(chǔ)上增加選項(xiàng)(之后產(chǎn)生了H.263+與H.263++)；另一個(gè)是長(zhǎng)期研究計(jì)劃，制定一種新標(biāo)準(zhǔn)以支持低碼率的視頻通信。長(zhǎng)期研究計(jì)劃產(chǎn)生了H.26L標(biāo)準(zhǔn)草案，在壓縮效率方面與先期的ITU-T視頻壓縮標(biāo)準(zhǔn)相比，具有明顯的優(yōu)越性。2001年，ISO的MPEG組織認(rèn)識(shí)到H.26L潛在的優(yōu)勢(shì)，隨后ISO與ITU開(kāi)始組建包括來(lái)自ISO/IEC MPEG與ITU-T VCEG的聯(lián)合視頻組(JVT)，JVT的主要任務(wù)就是將H.26L草案發(fā)展為一個(gè)國(guó)際性標(biāo)準(zhǔn)。于是，在ISO/IEC中該標(biāo)準(zhǔn)命名為AVC(Advanced Video Coding)，作為MPEG-4標(biāo)準(zhǔn)的第10個(gè)選項(xiàng)；在ITU-T中正式命名為H.264標(biāo)準(zhǔn)。H.264的主要優(yōu)點(diǎn)如下:

　　在相同的重建圖像質(zhì)量下，H.264比H.263+和MPEG-4(SP)減小50%碼率。

　　對(duì)信道時(shí)延的適應(yīng)性較強(qiáng)，既可工作于低時(shí)延模式以滿足實(shí)時(shí)業(yè)務(wù)，如會(huì)議電視等；又可工作于無(wú)時(shí)延限制的場(chǎng)合，如視頻存儲(chǔ)等。

　　提高網(wǎng)絡(luò)適應(yīng)性，采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語(yǔ)法，加強(qiáng)對(duì)誤碼和丟包的處理，提高解碼器的差錯(cuò)恢復(fù)能力。

　　在編/解碼器中采用復(fù)雜度可分級(jí)設(shè)計(jì)，在圖像質(zhì)量和編碼處理之間可分級(jí)，以適應(yīng)不同復(fù)雜度的應(yīng)用。

　　相對(duì)于先期的視頻壓縮標(biāo)準(zhǔn)，H.264引入了很多先進(jìn)的技術(shù)，包括4×4整數(shù)變換、空域內(nèi)的幀內(nèi)預(yù)測(cè)、1/4象素精度的運(yùn)動(dòng)估計(jì)、多參考幀與多種大小塊的幀間預(yù)測(cè)技術(shù)等。新技術(shù)帶來(lái)了較高的壓縮比，同時(shí)大大提高了算法的復(fù)雜度。

4×4整數(shù)變換

　　以前的標(biāo)準(zhǔn)，如H.263或MPEG-4，都是采用8x8的DCT變換。H.26L中建議的整數(shù)變換實(shí)際上接近于4×4的DCT變換，整數(shù)的引入降低了算法的復(fù)雜度，也避免了反變換的失配問(wèn)題，4×4的塊可以減小塊效應(yīng)。而H.264的4×4整數(shù)變換進(jìn)一步降低了算法的復(fù)雜度，相比H.26L中建議的整數(shù)變換，對(duì)于9b輸入殘差數(shù)據(jù)，由以前的32b降為現(xiàn)在的16b運(yùn)算，而且整個(gè)變換無(wú)乘法，只需加法和一些移位運(yùn)算。新的變換對(duì)編碼的性能幾乎沒(méi)有影響，而且實(shí)際編碼略好一些。

基于空域的幀內(nèi)預(yù)測(cè)技術(shù)

　　視頻編碼是通過(guò)去除圖像的空間與時(shí)間相關(guān)性來(lái)達(dá)到壓縮的目的?？臻g相關(guān)性通過(guò)有效的變換來(lái)去除，如DCT變換、H.264的整數(shù)變換；時(shí)間相關(guān)性則通過(guò)幀間預(yù)測(cè)來(lái)去除。這里所說(shuō)的變換去除空間相關(guān)性，僅僅局限在所變換的塊內(nèi)，如8×8或者4×4，并沒(méi)有塊與塊之間的處理。H.263+與MPEG-4引入了幀內(nèi)預(yù)測(cè)技術(shù)，在變換域中根據(jù)相臨塊對(duì)當(dāng)前塊的某些系數(shù)做預(yù)測(cè)。H.264則是在空域中，利用當(dāng)前塊的相臨象素直接對(duì)每個(gè)系數(shù)做預(yù)測(cè)，更有效地去除相臨塊之間的相關(guān)性，極大地提高了幀內(nèi)編碼的效率。

　　H.264基本部分的幀內(nèi)預(yù)測(cè)包括9種4×4亮度塊的預(yù)測(cè)、4種16×16亮度塊的預(yù)測(cè)和4種色度塊的預(yù)測(cè)。

運(yùn)動(dòng)估計(jì)

　　H.264的運(yùn)動(dòng)估計(jì)具有3個(gè)新的特點(diǎn)：1/4象素精度的運(yùn)動(dòng)估計(jì)；7種大小不同的塊進(jìn)行匹配；前向與后向多參考幀。

　　H.264在幀間編碼中，一個(gè)宏塊(16×16)可以被分為16×8、8×16、8×8的塊，而8×8的塊被稱為子宏塊，又可以分為8×4、4×8、4×4的塊?？傮w而言，共有7種大小不同的塊做運(yùn)動(dòng)估計(jì)，以找出最匹配的類型。與以往標(biāo)準(zhǔn)的P幀、B幀不同，H.264采用了前向與后向多個(gè)參考幀的預(yù)測(cè)。半象素精度的運(yùn)動(dòng)估計(jì)比整象素運(yùn)動(dòng)估計(jì)有效地提高了壓縮比，而1/4象素精度的運(yùn)動(dòng)估計(jì)可帶來(lái)更好的壓縮效果。

　　編碼器中運(yùn)用多種大小不同的塊進(jìn)行運(yùn)動(dòng)估計(jì)，可節(jié)省15%以上的比特率(相對(duì)于16×16的塊)。運(yùn)用1/4象素精度的運(yùn)動(dòng)估計(jì)，可以節(jié)省20%的碼率(相對(duì)于整象素預(yù)測(cè))。多參考幀預(yù)測(cè)方面，假設(shè)為5個(gè)參考幀預(yù)測(cè)，相對(duì)于一個(gè)參考幀，可降低5%～10%的碼率。以上百分比都是統(tǒng)計(jì)數(shù)據(jù)，不同視頻因其細(xì)節(jié)特征與運(yùn)動(dòng)情況而有所差異。

熵編碼

　　H.264標(biāo)準(zhǔn)采用的熵編碼有兩種：一種是基于內(nèi)容的自適應(yīng)變長(zhǎng)編碼(CAVLC)與統(tǒng)一的變長(zhǎng)編碼(UVLC)結(jié)合；另一種是基于內(nèi)容的自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC)。CAVLC與CABAC根據(jù)相臨塊的情況進(jìn)行當(dāng)前塊的編碼，以達(dá)到更好的編碼效率。CABAC比CAVLC壓縮效率高，但要復(fù)雜一些。

去塊效應(yīng)濾波器

　　H.264標(biāo)準(zhǔn)引入了去塊效應(yīng)濾波器，對(duì)塊的邊界進(jìn)行濾波，濾波強(qiáng)度與塊的編碼模式、運(yùn)動(dòng)矢量及塊的系數(shù)有關(guān)。去塊效應(yīng)濾波器在提高壓縮效率的同時(shí)，改善了圖像的主觀效果。

其他視頻編碼標(biāo)準(zhǔn)

　　除上述ITU-T的視頻壓縮標(biāo)準(zhǔn)外，還有一些標(biāo)準(zhǔn)也比較流行，如MPEG-4、AVS、WM9。

H.264也稱為MPEG-4 AVC，而目前業(yè)內(nèi)所說(shuō)的MPEG-4一般是指SP(簡(jiǎn)級(jí))或ASP(先進(jìn)的簡(jiǎn)級(jí))，主要針對(duì)低碼率應(yīng)用，如因特網(wǎng)上的流媒體、無(wú)線網(wǎng)的視頻傳輸及視頻存儲(chǔ)等，其核心類似于H.263。

M　　PEG-4 SP和H.263有很多相似的地方，如附表所示。然而，這兩個(gè)標(biāo)準(zhǔn)之間也有顯著的不同，主要表現(xiàn)在：碼流結(jié)構(gòu)和頭信息、熵編碼的部分碼表、編碼技術(shù)的一些細(xì)節(jié)。MPEG-4 ASP較SP增加了一些技術(shù)，主要有：1/4象素精度的運(yùn)動(dòng)估計(jì)、B幀、全局運(yùn)動(dòng)矢量(GMV)，因而壓縮效率得以提高。

　　AVS是由我國(guó)自主制定的音/視頻編碼技術(shù)標(biāo)準(zhǔn)，主要面向高清晰度電視、高密度光存儲(chǔ)媒體等應(yīng)用。AVS標(biāo)準(zhǔn)以當(dāng)前國(guó)際上最先進(jìn)的MPEG-4 AVC/H.264框架為基礎(chǔ)，強(qiáng)調(diào)自主知識(shí)產(chǎn)權(quán)，同時(shí)充分考慮了實(shí)現(xiàn)的復(fù)雜度。相對(duì)于H.264，AVS的主要特點(diǎn)有：(1)8×8的整數(shù)變換與64級(jí)量化；(2)亮度和色度幀內(nèi)預(yù)測(cè)都是以8×8塊為單位，亮度塊采用5種預(yù)測(cè)模式，色度塊采用4種預(yù)測(cè)模式；(3)采用16×16、16×8、8×16和8×8 4種塊模式進(jìn)行運(yùn)動(dòng)補(bǔ)償；(4)在1/4象素運(yùn)動(dòng)估計(jì)方面，采用不同的四抽頭濾波器進(jìn)行半象素插值和1/4象素插值；(5)P幀可以利用最多2幀的前向參考幀，而B幀采用前后各一個(gè)參考幀。

　　Window Meida 9(WM9)是微軟公司開(kāi)發(fā)的新一代數(shù)字媒體技術(shù)。一些測(cè)試表明，WM9的視頻壓縮效率比MPEG-2、MPEG-4 SP及H.263高很多，而與H.264的壓縮效率相當(dāng)。

結(jié)束語(yǔ)

　　目前，H.261與H.263在視頻通信中廣泛應(yīng)用，成熟的產(chǎn)品已經(jīng)很多。H.263與H.261相比，增加了若干選項(xiàng)，提供了更靈活的編碼方式，壓縮效率大大提高，更適應(yīng)網(wǎng)絡(luò)傳輸。H.264標(biāo)準(zhǔn)的推出，是視頻編碼標(biāo)準(zhǔn)的一次重要進(jìn)步，它與現(xiàn)有的MPEG-2、MPEG-4 SP及H.263相比，具有明顯的優(yōu)越性，特別是在編碼效率上的提高，使之能用于許多新的領(lǐng)域。盡管H.264的算法復(fù)雜度是現(xiàn)有編碼壓縮標(biāo)準(zhǔn)的4倍以上，隨著集成電路技術(shù)的快速發(fā)展，H.264的應(yīng)用將成為現(xiàn)實(shí)。

中寬網(wǎng)

xiaochongchong 發(fā)表于 >2005-1-2 11:30:14

[全文] [評(píng)論] [引用] [推薦] [檔案] [推給好友]

2005-1-1

04--05

04的夢(mèng)已做完，05的已經(jīng)開(kāi)始。

xiaochongchong 發(fā)表于 >2005-1-1 0:34:05

[全文] [評(píng)論] [引用] [推薦] [檔案] [推給好友]

2004-12-28

MPEG-4簡(jiǎn)介

下學(xué)期開(kāi)始做視頻編碼相關(guān)的工作，以后就多關(guān)注這方面的技術(shù)了。

    MPEG4視頻壓縮編碼技術(shù)詳解
    MPEG全稱是Moving Pictures Experts Group，它是"動(dòng)態(tài)圖象專家組"的英文縮寫，該專家組成立于1988年，致力于運(yùn)動(dòng)圖像及其伴音的壓縮編碼標(biāo)準(zhǔn)化工作，原先他們打算開(kāi)發(fā)MPEG1、MPEG2、MPEG3和MPEG4四個(gè)版本，以適用于不同帶寬和數(shù)字影像質(zhì)量的要求。
    目前，MPEG1技術(shù)被廣泛的應(yīng)用于VCD，而MPEG2標(biāo)準(zhǔn)則用于廣播電視和DVD等。MPEG3最初是為HDTV開(kāi)發(fā)的編碼和壓縮標(biāo)準(zhǔn)，但由于MPEG2的出色性能表現(xiàn)， MPEG3只能是死于襁褓了。而我們今天要談?wù)摰闹鹘?-MPEG4于1999年初正式成為國(guó)際標(biāo)準(zhǔn)。它是一個(gè)適用于低傳輸速率應(yīng)用的方案。與MPEG1和MPEG2相比，MPEG4更加注重多媒體系統(tǒng)的交互性和靈活性。下面就讓我們一起進(jìn)入多彩的MPEG4世界。
    MPEG4的技術(shù)特點(diǎn)
    MPEG1、MPEG2技術(shù)當(dāng)初制定時(shí)，它們定位的標(biāo)準(zhǔn)均為高層媒體表示與結(jié)構(gòu)，但隨著計(jì)算機(jī)軟件及網(wǎng)絡(luò)技術(shù)的快速發(fā)展，MPEG1.MPEG2技術(shù)的弊端就顯示出來(lái)了：交互性及靈活性較低，壓縮的多媒體文件體積過(guò)于龐大，難以實(shí)現(xiàn)網(wǎng)絡(luò)的實(shí)時(shí)傳播。而MPEG4技術(shù)的標(biāo)準(zhǔn)是對(duì)運(yùn)動(dòng)圖像中的內(nèi)容進(jìn)行編碼，其具體的編碼對(duì)象就是圖像中的音頻和視頻，術(shù)語(yǔ)稱為"AV對(duì)象"，而連續(xù)的AV對(duì)象組合在一起又可以形成AV場(chǎng)景。因此，MPEG4標(biāo)準(zhǔn)就是圍繞著AV對(duì)象的編碼、存儲(chǔ)、傳輸和組合而制定的，高效率地編碼、組織、存儲(chǔ)、傳輸AV對(duì)象是MPEG4標(biāo)準(zhǔn)的基本內(nèi)容。
    在視頻編碼方面，MPEG4支持對(duì)自然和合成的視覺(jué)對(duì)象的編碼。（合成的視覺(jué)對(duì)象包括2D、3D動(dòng)畫和人面部表情動(dòng)畫等）。在音頻編碼上，MPEG4可以在一組編碼工具支持下，對(duì)語(yǔ)音、音樂(lè)等自然聲音對(duì)象和具有回響、空間方位感的合成聲音對(duì)象進(jìn)行音頻編碼。
由于MPEG4只處理圖像幀與幀之間有差異的元素，而舍棄相同的元素，因此大大減少了合成多媒體文件的體積。應(yīng)用MPEG4技術(shù)的影音文件最顯著特點(diǎn)就是壓縮率高且成像清晰，一般來(lái)說(shuō)，一小時(shí)的影像可以被壓縮為350M左右的數(shù)據(jù)，而一部高清晰度的DVD電影, 可以壓縮成兩張甚至一張650M CD光碟來(lái)存儲(chǔ)。對(duì)廣大的"平民"計(jì)算機(jī)用戶來(lái)說(shuō)，這就意味著, 您不需要購(gòu)置 DVD-ROM就可以欣賞近似DVD質(zhì)量的高品質(zhì)影像。而且采用MPEG4編碼技術(shù)的影片，對(duì)機(jī)器硬件配置的要求非常之低，300MHZ 以上CPU，64M的內(nèi)存和一個(gè) 8M顯存的顯卡就可以流暢的播放。在播放軟件方面，它要求也非常寬松，你只需要安裝一個(gè) 500K左右的 MPEG4 編碼驅(qū)動(dòng)后，用 WINDOWS 自帶的媒體播放器就可以流暢的播放了（下面我們會(huì)具體講到）。
    視頻編碼研究與MPEG標(biāo)準(zhǔn)演進(jìn)
人類獲取的信息中70%來(lái)自于視覺(jué)，視頻信息在多媒體信息中占有重要地位；同時(shí)視頻數(shù)據(jù)冗余度最大，經(jīng)壓縮處理后的視頻質(zhì)量高低是決定多媒體服務(wù)質(zhì)量的關(guān)鍵因素。因此數(shù)字視頻技術(shù)是多媒體應(yīng)用的核心技術(shù)，對(duì)視頻編碼的研究已成為信息技術(shù)領(lǐng)域的熱門話題。
視頻編碼的研究課題主要有數(shù)據(jù)壓縮比、壓縮/解壓速度及快速實(shí)現(xiàn)算法三方面內(nèi)容。以壓縮/解壓后數(shù)據(jù)與壓縮前原始數(shù)據(jù)是否完全一致作為衡量標(biāo)準(zhǔn)，可將數(shù)據(jù)壓縮劃分為無(wú)失真壓縮（即可逆壓縮）和有失真壓縮（即不可逆壓縮）兩類。
    傳統(tǒng)壓縮編碼建立在仙農(nóng)信息論基礎(chǔ)之上的，以經(jīng)典集合論為工具，用概率統(tǒng)計(jì)模型來(lái)描述信源，其壓縮思想基于數(shù)據(jù)統(tǒng)計(jì)，因此只能去除數(shù)據(jù)冗余，屬于低層壓縮編碼的范疇。伴隨著視頻編碼相關(guān)學(xué)科及新興學(xué)科的迅速發(fā)展，新一代數(shù)據(jù)壓縮技術(shù)不斷誕生并日益成熟，其編碼思想由基于像素和像素塊轉(zhuǎn)變?yōu)榛趦?nèi)容（content-based）。它突破了仙農(nóng)信息論框架的束縛，充分考慮了人眼視覺(jué)特性及信源特性，通過(guò)去除內(nèi)容冗余來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮，可分為基于對(duì)象（object-based）和基于語(yǔ)義（semantics-based）兩種，前者屬于中層壓縮編碼，后者屬于高層壓縮編碼。
    與此同時(shí)，視頻編碼相關(guān)標(biāo)準(zhǔn)的制定也日臻完善。視頻編碼標(biāo)準(zhǔn)主要由ITU-T和ISO/IEC開(kāi)發(fā)。ITU-T發(fā)布的視頻標(biāo)準(zhǔn)有H.261、 H.262、 H.263、 H.263+、H.263++，ISO/IEC公布的MPEG系列標(biāo)準(zhǔn)有MPEG-1、MPEG-2 、MPEG-4 和MPEG-7，并且計(jì)劃公布MPEG-21。
    MPEG即Moving Picture Expert Group（運(yùn)動(dòng)圖像專家組），它是專門從事制定多媒體視音頻壓縮編碼標(biāo)準(zhǔn)的國(guó)際組織。MPEG系列標(biāo)準(zhǔn)已成為國(guó)際上影響最大的多媒體技術(shù)標(biāo)準(zhǔn)，其中MPEG-1和MPEG-2是采用以仙農(nóng)信息論為基礎(chǔ)的預(yù)測(cè)編碼、變換編碼、熵編碼及運(yùn)動(dòng)補(bǔ)償?shù)鹊谝淮鷶?shù)據(jù)壓縮編碼技術(shù)；MPEG-4（ISO/IEC 14496）則是基于第二代壓縮編碼技術(shù)制定的國(guó)際標(biāo)準(zhǔn)，它以視聽(tīng)媒體對(duì)象為基本單元，采用基于內(nèi)容的壓縮編碼，以實(shí)現(xiàn)數(shù)字視音頻、圖形合成應(yīng)用及交互式多媒體的集成。MPEG系列標(biāo)準(zhǔn)對(duì)VCD、DVD等視聽(tīng)消費(fèi)電子及數(shù)字電視和高清晰度電視（DTV&&HDTV）、多媒體通信等信息產(chǎn)業(yè)的發(fā)展產(chǎn)生了巨大而深遠(yuǎn)的影響。

   MPEG-4視頻編碼核心思想及關(guān)鍵技術(shù)

   核心思想
   在MPEG-4制定之前，MPEG-1、MPEG-2、H.261、H.263都是采用第一代壓縮編碼技術(shù)，著眼于圖像信號(hào)的統(tǒng)計(jì)特性來(lái)設(shè)計(jì)編碼器，屬于波形編碼的范疇。第一代壓縮編碼方案把視頻序列按時(shí)間先后分為一系列幀，每一幀圖像又分成宏塊以進(jìn)行運(yùn)動(dòng)補(bǔ)償和編碼，這種編碼方案存在以下缺陷：
· 將圖像固定地分成相同大小的塊，在高壓縮比的情況下會(huì)出現(xiàn)嚴(yán)重的塊效應(yīng)，即馬賽克效應(yīng)；
· 不能對(duì)圖像內(nèi)容進(jìn)行訪問(wèn)、編輯和回放等*作；
· 未充分利用人類視覺(jué)系統(tǒng)（HVS，Human Visual System）的特性。
    MPEG-4則代表了基于模型/對(duì)象的第二代壓縮編碼技術(shù)，它充分利用了人眼視覺(jué)特性，抓住了圖像信息傳輸?shù)谋举|(zhì)，從輪廓、紋理思路出發(fā)，支持基于視覺(jué)內(nèi)容的交互功能，這適應(yīng)了多媒體信息的應(yīng)用由播放型轉(zhuǎn)向基于內(nèi)容的訪問(wèn)、檢索及*作的發(fā)展趨勢(shì)。
AV對(duì)象（AVO，Audio Visual Object）是MPEG-4為支持基于內(nèi)容編碼而提出的重要概念。對(duì)象是指在一個(gè)場(chǎng)景中能夠訪問(wèn)和*縱的實(shí)體，對(duì)象的劃分可根據(jù)其獨(dú)特的紋理、運(yùn)動(dòng)、形狀、模型和高層語(yǔ)義為依據(jù)。在MPEG-4中所見(jiàn)的視音頻已不再是過(guò)去MPEG-1、MPEG-2中圖像幀的概念，而是一個(gè)個(gè)視聽(tīng)場(chǎng)景（AV場(chǎng)景），這些不同的AV場(chǎng)景由不同的AV對(duì)象組成。AV對(duì)象是聽(tīng)覺(jué)、視覺(jué)、或者視聽(tīng)內(nèi)容的表示單元，其基本單位是原始AV對(duì)象，它可以是自然的或合成的聲音、圖像。原始AV對(duì)象具有高效編碼、高效存儲(chǔ)與傳輸以及可交互*作的特性，它又可進(jìn)一步組成復(fù)合AV對(duì)象。因此MPEG-4標(biāo)準(zhǔn)的基本內(nèi)容就是對(duì)AV對(duì)象進(jìn)行高效編碼、組織、存儲(chǔ)與傳輸。AV對(duì)象的提出，使多媒體通信具有高度交互及高效編碼的能力，AV對(duì)象編碼就是MPEG-4的核心編碼技術(shù)。
    MPEG-4不僅可提供高壓縮率，同時(shí)也可實(shí)現(xiàn)更好的多媒體內(nèi)容互動(dòng)性及全方位的存取性，它采用開(kāi)放的編碼系統(tǒng)，可隨時(shí)加入新的編碼算法模塊，同時(shí)也可根據(jù)不同應(yīng)用需求現(xiàn)場(chǎng)配置解碼器，以支持多種多媒體應(yīng)用。
    MPEG-4 采用了新一代視頻編碼技術(shù)，它在視頻編碼發(fā)展史上第一次把編碼對(duì)象從圖像幀拓展到具有實(shí)際意義的任意形狀視頻對(duì)象，從而實(shí)現(xiàn)了從基于像素的傳統(tǒng)編碼向基于對(duì)象和內(nèi)容的現(xiàn)代編碼的轉(zhuǎn)變，因而引領(lǐng)著新一代智能圖像編碼的發(fā)展潮流。
    關(guān)鍵技術(shù)
MPEG-4除采用第一代視頻編碼的核心技術(shù)，如變換編碼、運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償、量化、熵編碼外，還提出了一些新的有創(chuàng)見(jiàn)性的關(guān)鍵技術(shù)，并在第一代視頻編碼技術(shù)基礎(chǔ)上進(jìn)行了卓有成效的完善和改進(jìn)。下面重點(diǎn)介紹其中的一些關(guān)鍵技術(shù)。
    A. 視頻對(duì)象提取技術(shù)
MPEG-4實(shí)現(xiàn)基于內(nèi)容交互的首要任務(wù)就是把視頻/圖像分割成不同對(duì)象或者把運(yùn)動(dòng)對(duì)象從背景中分離出來(lái)，然后針對(duì)不同對(duì)象采用相應(yīng)編碼方法，以實(shí)現(xiàn)高效壓縮。因此視頻對(duì)象提取即視頻對(duì)象分割，是MPEG-4視頻編碼的關(guān)鍵技術(shù)，也是新一代視頻編碼的研究熱點(diǎn)和難點(diǎn)。
視頻對(duì)象分割涉及對(duì)視頻內(nèi)容的分析和理解，這與人工智能、圖像理解、模式識(shí)別和神經(jīng)網(wǎng)絡(luò)等學(xué)科有密切聯(lián)系。目前人工智能的發(fā)展還不夠完善，計(jì)算機(jī)還不具有觀察、識(shí)別、理解圖像的能力；同時(shí)關(guān)于計(jì)算機(jī)視覺(jué)的研究也表明要實(shí)現(xiàn)正確的圖像分割需要在更高層次上對(duì)視頻內(nèi)容進(jìn)行理解。因此，盡管MPEG-4 框架已經(jīng)制定，但至今仍沒(méi)有通用的有效方法去根本解決視頻對(duì)象分割問(wèn)題，視頻對(duì)象分割被認(rèn)為是一個(gè)具有挑戰(zhàn)性的難題，基于語(yǔ)義的分割則更加困難。
    目前進(jìn)行視頻對(duì)象分割的一般步驟是：先對(duì)原始視頻/圖像數(shù)據(jù)進(jìn)行簡(jiǎn)化以利于分割，這可通過(guò)低通濾波、中值濾波、形態(tài)濾波來(lái)完成；然后對(duì)視頻/圖像數(shù)據(jù)進(jìn)行特征提取，可以是顏色、紋理、運(yùn)動(dòng)、幀差、位移幀差乃至語(yǔ)義等特征；再基于某種均勻性標(biāo)準(zhǔn)來(lái)確定分割決策，根據(jù)所提取特征將視頻數(shù)據(jù)歸類；最后是進(jìn)行相關(guān)后處理，以實(shí)現(xiàn)濾除噪聲及準(zhǔn)確提取邊界。
    在視頻分割中基于數(shù)學(xué)形態(tài)理論的分水嶺（watershed）算法被廣泛使用，它又稱水線算法，其基本過(guò)程是連續(xù)腐蝕二值圖像，由圖像簡(jiǎn)化、標(biāo)記提取、決策、后處理四個(gè)階段構(gòu)成。分水嶺算法具有運(yùn)算簡(jiǎn)單、性能優(yōu)良，能夠較好提取運(yùn)動(dòng)對(duì)象輪廓、準(zhǔn)確得到運(yùn)動(dòng)物體邊緣的優(yōu)點(diǎn)。但分割時(shí)需要梯度信息，對(duì)噪聲較敏感，且未利用幀間信息，通常會(huì)產(chǎn)生圖像過(guò)度分割。
    B. VOP視頻編碼技術(shù)
    視頻對(duì)象平面（VOP，Video Object Plane）是視頻對(duì)象（VO）在某一時(shí)刻的采樣，VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過(guò)程中針對(duì)不同VO采用不同的編碼策略，即對(duì)前景VO的壓縮編碼盡可能保留細(xì)節(jié)和平滑；對(duì)背景VO則采用高壓縮率的編碼策略，甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對(duì)象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產(chǎn)生的方塊效應(yīng)，而且使用戶可與場(chǎng)景交互，從而既提高了壓縮比，又實(shí)現(xiàn)了基于內(nèi)容的交互，為視頻編碼提供了廣闊的發(fā)展空間。
MPEG-4支持任意形狀圖像與視頻的編解碼。對(duì)于任意形狀視頻對(duì)象。對(duì)于極低比特率實(shí)時(shí)應(yīng)用，如可視電話、會(huì)議電視，MPEG-4則采用VLBV（Very Low Bit-rate Video，極低比特率視頻）核進(jìn)行編碼。
    傳統(tǒng)的矩形圖在MPEG-4中被看作是VO的一種特例，這正體現(xiàn)了傳統(tǒng)編碼與基于內(nèi)容編碼在MPEG-4中的統(tǒng)一。VO概念的引入，更加符合人腦對(duì)視覺(jué)信息的處理方式，并使視頻信號(hào)的處理方式從數(shù)字化進(jìn)展到智能化，從而提高了視頻信號(hào)的交互性和靈活性，使得更廣泛的視頻應(yīng)用及更多的內(nèi)容交互成為可能。因此VOP視頻編碼技術(shù)被譽(yù)為視頻信號(hào)處理技術(shù)從數(shù)字化進(jìn)入智能化的初步探索。
    C. 視頻編碼可分級(jí)性技術(shù)
    隨著因特網(wǎng)業(yè)務(wù)的巨大增長(zhǎng)，在速率起伏很大的IP（Internet Protocol）網(wǎng)絡(luò)及具有不同傳輸特性的異構(gòu)網(wǎng)絡(luò)上進(jìn)行視頻傳輸?shù)囊蠛蛻?yīng)用越來(lái)越多。在這種背景下，視頻分級(jí)編碼的重要性日益突出，其應(yīng)用非常廣泛，且具有很高的理論研究及實(shí)際應(yīng)用價(jià)值，因此受到人們的極大關(guān)注。
    視頻編碼的可分級(jí)性（scalability）是指碼率的可調(diào)整性，即視頻數(shù)據(jù)只壓縮一次，卻能以多個(gè)幀率、空間分辨率或視頻質(zhì)量進(jìn)行解碼，從而可支持多種類型用戶的各種不同應(yīng)用要求。
    MPEG-4通過(guò)視頻對(duì)象層（VOL，Video Object Layer）數(shù)據(jù)結(jié)構(gòu)來(lái)實(shí)現(xiàn)分級(jí)編碼。MPEG-4提供了兩種基本分級(jí)工具，即時(shí)域分級(jí)（Temporal Scalability）和空域分級(jí)（Spatial Scalability），此外還支持時(shí)域和空域的混合分級(jí)。每一種分級(jí)編碼都至少有兩層VOL，低層稱為基本層，高層稱為增強(qiáng)層。基本層提供了視頻序列的基本信息，增強(qiáng)層提供了視頻序列更高的分辨率和細(xì)節(jié)。
    在隨后增補(bǔ)的視頻流應(yīng)用框架中，MPEG-4提出了FGS（Fine Granularity Scalable，精細(xì)可伸縮性）視頻編碼算法以及PFGS（Progressive Fine Granularity Scalable，漸進(jìn)精細(xì)可伸縮性）視頻編碼算法。
    FGS編碼實(shí)現(xiàn)簡(jiǎn)單，可在編碼速率、顯示分辨率、內(nèi)容、解碼復(fù)雜度等方面提供靈活的自適應(yīng)和可擴(kuò)展性，且具有很強(qiáng)的帶寬自適應(yīng)能力和抗誤碼性能。但還存在編碼效率低于非可擴(kuò)展編碼及接收端視頻質(zhì)量非最優(yōu)兩個(gè)不足。
    PFGS則是為改善FGS編碼效率而提出的視頻編碼算法，其基本思想是在增強(qiáng)層圖像編碼時(shí)使用前一幀重建的某個(gè)增強(qiáng)層圖像為參考進(jìn)行運(yùn)動(dòng)補(bǔ)償，以使運(yùn)動(dòng)補(bǔ)償更加有效，從而提高編碼效率。
    D. 運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償技術(shù)
    MPEG-4采用I-VOP、P-VOP、B-VOP三種幀格式來(lái)表征不同的運(yùn)動(dòng)補(bǔ)償類型。它采用了H.263中的半像素搜索（half pixel searching）技術(shù)和重疊運(yùn)動(dòng)補(bǔ)償（overlapped motion compensation)技術(shù)，同時(shí)又引入重復(fù)填充（repetitive padding）技術(shù)和修改的塊（多邊形）匹配（modified block （polygon）matching）技術(shù)以支持任意形狀的VOP區(qū)域。
    此外，為提高運(yùn)動(dòng)估計(jì)算法精度，MPEG-4采用了MVFAST（Motion Vector Field Adaptive Search Technique）和改進(jìn)的PMVFAST（Predictive MVFAST）方法用于運(yùn)動(dòng)估計(jì)。對(duì)于全局運(yùn)動(dòng)估計(jì)，則采用了基于特征的快速頑健的FFRGMET（Feature-based Fast and Robust Global Motion Estimation Technique）方法。
在MPEG-4視頻編碼中，運(yùn)動(dòng)估計(jì)相當(dāng)耗時(shí)，對(duì)編碼的實(shí)時(shí)性影響很大。因此這里特別強(qiáng)調(diào)快速算法。運(yùn)動(dòng)估計(jì)方法主要有像素遞歸法和塊匹配法兩大類，前者復(fù)雜度很高，實(shí)際中應(yīng)用較少，后者則在H.263和MPEG中廣泛采用。在塊匹配法中，重點(diǎn)研究塊匹配準(zhǔn)則及搜索方法。目前有三種常用的匹配準(zhǔn)則：
（1）絕對(duì)誤差和（SAD, Sum of Absolute Difference）準(zhǔn)則；
（2）均方誤差（MSE, Mean Square Error）準(zhǔn)則；
（3）歸一化互相關(guān)函數(shù)（NCCF, Normalized Cross Correlation Function）準(zhǔn)則。
    在上述三種準(zhǔn)則中，SAD準(zhǔn)則具有不需乘法運(yùn)算、實(shí)現(xiàn)簡(jiǎn)單方便的優(yōu)點(diǎn)而使用最多，但應(yīng)清楚匹配準(zhǔn)則的選用對(duì)匹配結(jié)果影響不大。
在選取匹配準(zhǔn)則后就應(yīng)進(jìn)行尋找最優(yōu)匹配點(diǎn)的搜索工作。最簡(jiǎn)單、最可靠的方法是全搜索法（FS, Full Search），但計(jì)算量太大，不便于實(shí)時(shí)實(shí)現(xiàn)。因此快速搜索法應(yīng)運(yùn)而生，主要有交叉搜索法、二維對(duì)數(shù)法和鉆石搜索法，其中鉆石搜索法被MPEG-4校驗(yàn)?zāi)Ｐ停╒M, Verification Model）所采納，下面詳細(xì)介紹。
鉆石搜索（DS, Diamond Search）法以搜索模板形狀而得名，具有簡(jiǎn)單、魯棒、高效的特點(diǎn)，是現(xiàn)有性能最優(yōu)的快速搜索算法之一。其基本思想是利用搜索模板的形狀和大小對(duì)運(yùn)動(dòng)估計(jì)算法速度及精度產(chǎn)生重要影響的特性。在搜索最優(yōu)匹配點(diǎn)時(shí)，選擇小的搜索模板可能會(huì)陷入局部最優(yōu)，選擇大的搜索模板則可能無(wú)法找到最優(yōu)點(diǎn)。因此DS算法針對(duì)視頻圖像中運(yùn)動(dòng)矢量的基本規(guī)律，選用了兩種形狀大小的搜索模板。
· 大鉆石搜索模板（LDSP, Large Diamond Search Pattern），包含9個(gè)候選位置；
· 小鉆石搜索模板（SDSP, Small Diamond Search Pattern），包含5個(gè)候選位置。
    DS算法搜索過(guò)程如下：開(kāi)始階段先重復(fù)使用大鉆石搜索模板，直到最佳匹配塊落在大鉆石中心。由于LDSP步長(zhǎng)大，因而搜索范圍廣，可實(shí)現(xiàn)粗定位，使搜索不會(huì)陷于局部最小，當(dāng)粗定位結(jié)束后，可認(rèn)為最優(yōu)點(diǎn)就在LDSP 周圍8 個(gè)點(diǎn)所圍菱形區(qū)域中。然后再使用小鉆石搜索模板來(lái)實(shí)現(xiàn)最佳匹配塊的準(zhǔn)確定位，以不產(chǎn)生較大起伏，從而提高運(yùn)動(dòng)估計(jì)精度。
此外Sprite視頻編碼技術(shù)也在MPEG-4中應(yīng)用廣泛，作為其核心技術(shù)之一。Sprite又稱鑲嵌圖或背景全景圖，是指一個(gè)視頻對(duì)象在視頻序列中所有出現(xiàn)部分經(jīng)拼接而成的一幅圖像。利用Sprite可以直接重構(gòu)該視頻對(duì)象或?qū)ζ溥M(jìn)行預(yù)測(cè)補(bǔ)償編碼。
    Sprite視頻編碼可視為一種更為先進(jìn)的運(yùn)動(dòng)估計(jì)和補(bǔ)償技術(shù)，它能夠克服基于固定分塊的傳統(tǒng)運(yùn)動(dòng)估計(jì)和補(bǔ)償技術(shù)的不足，MPEG-4正是采用了將傳統(tǒng)分塊編碼技術(shù)與Sprite編碼技術(shù)相結(jié)合的策略。

    MPEG4的應(yīng)用領(lǐng)域
    憑借著出色的性能，MPEG4技術(shù)目前在多媒體傳輸、多媒體存儲(chǔ)等領(lǐng)域得到了廣泛的應(yīng)用，下面我們就來(lái)看看目前在那些領(lǐng)域MPEG4技術(shù)得到了大顯伸手的機(jī)會(huì)。
    1、精彩的視頻世界
精彩的視頻世界是MPEG4技術(shù)應(yīng)用最多也是最為廣大朋友所熟悉的的形式。目前它主要以兩種形式出現(xiàn)，一種是DIVX－MPEG4影碟（國(guó)內(nèi)市面上已出現(xiàn)，且D版居多），另一種是網(wǎng)上MPEG4電影。
  （1）、我們先來(lái)說(shuō)說(shuō)DIVX－MPEG4影碟，DIVX視頻編碼技術(shù)實(shí)際上就是MPEG4壓縮技術(shù)，它由微軟MPEG4V3修改而來(lái)，使用的是MPEG4壓縮算法，并同時(shí)分離視頻和音頻。它的核心部分便是由DivX對(duì)DVD音視頻進(jìn)行壓縮，生成Mpeg4視頻格式文件(也就是AVI格式)。
小提示：筆者也是經(jīng)常被朋友所問(wèn)到："我看到的MPEG4電影片段明明是avi（擴(kuò)展名）格式文件，并且Windows的媒體播放器也與之關(guān)聯(lián)，但就是無(wú)法播放"。其實(shí)， MPEG4并沒(méi)有確定必須用什么擴(kuò)展名，它只是一種編碼方法而已。使用avi作為擴(kuò)展名，是一種習(xí)慣性的沿用。
在計(jì)算機(jī)上播放MPEG4影音文件的方法目前有兩種：第一種是用諸如DivxPlayer等專門的播放軟件來(lái)播放；第二種播放方法是安裝MPEG4(Divx)插件后，用Windows自帶的媒體播放機(jī)來(lái)播放。
   （2）、隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展，互聯(lián)網(wǎng)上的視頻流應(yīng)用也成為了近幾年的熱門話題。目前，在互聯(lián)網(wǎng)上比較流行的幾種影像格式包括Quicktime、RealPlay以及微軟的MediaPlayer等。MPEG4技術(shù)出現(xiàn)之后，互聯(lián)網(wǎng)上又出現(xiàn)了MPEG4格式的電影，不過(guò)在觀看前，系統(tǒng)會(huì)提示你下載最新的MPEG4解碼軟件。
小提示：大家平時(shí)在網(wǎng)上可能經(jīng)常會(huì)看見(jiàn)ASF格式的電影，其實(shí)它也是微軟公司開(kāi)發(fā)出的一種可以直接在網(wǎng)上觀看視頻節(jié)目的壓縮格式。使用的也是MPEG4的壓縮算法，但因?yàn)樗且跃W(wǎng)上即時(shí)觀看電影的視頻流格式存在的，所以它的圖像質(zhì)量相對(duì)要差一些。

    2、低比特率下的多媒體通信，
目前，MPEG4技術(shù)已經(jīng)廣泛的應(yīng)用在如視頻電話、視頻電子郵件、移動(dòng)通信、電子新聞等多媒體通信領(lǐng)域。由于這些應(yīng)用對(duì)傳輸速率要求較低，一般在4.8～64kbit/s之間，分辨率為176×144左右。因此MPEG4技術(shù)完全可以充分的利用網(wǎng)絡(luò)帶寬，通過(guò)幀重建技術(shù)壓縮和傳輸數(shù)據(jù)，以最少的數(shù)據(jù)量獲得最佳的圖像質(zhì)量。

    3、實(shí)時(shí)多媒體監(jiān)控。
多媒體監(jiān)控領(lǐng)域原來(lái)一直是MPEG1技術(shù)擔(dān)當(dāng)重任，但近些年來(lái)，它們也是"城頭變換大王旗"了。由于MPEG4壓縮技術(shù)原本是一種適用在低帶寬下進(jìn)行信息交換的音視頻處理技術(shù)，它的特點(diǎn)是可以動(dòng)態(tài)的偵測(cè)圖像各個(gè)區(qū)域變化，基于對(duì)象的調(diào)整壓縮方法可以獲得比MPEG1更大的壓縮比，使壓縮碼流更低。因此，盡管MPEG4技術(shù)一開(kāi)始并不是專為視頻監(jiān)控壓縮領(lǐng)域而開(kāi)發(fā)的，但它高清晰度的視頻壓縮，在實(shí)時(shí)多媒體監(jiān)控上，無(wú)能是存儲(chǔ)量，傳輸?shù)乃俾?，清晰度都比MPEG1具有更大的優(yōu)勢(shì)。

    4、基于內(nèi)容存儲(chǔ)和檢索的多媒體系統(tǒng)。
由于MPEG4在壓縮方法上遠(yuǎn)遠(yuǎn)優(yōu)于MPEG1技術(shù)，更是MJPEG技術(shù)所不能比擬的。經(jīng)過(guò)專家的測(cè)試表明，在相同清晰度對(duì)應(yīng)MPEG1（500Kbits/sec）碼流情況下， MPEG4比MPEG1節(jié)省了2/3的硬盤空間，在一般活動(dòng)場(chǎng)景下也節(jié)省近一般的容量。因此無(wú)論是從內(nèi)容存儲(chǔ)量，還是從多媒體文件的檢索速度來(lái)說(shuō)，MPEG4技術(shù)都是多媒體系統(tǒng)應(yīng)用的不二之選。

    5、硬件產(chǎn)品上面的應(yīng)用
目前，MPEG4技術(shù)在硬件產(chǎn)品上也已開(kāi)始逐步得到應(yīng)用。特別是在視頻監(jiān)控、播放上，這項(xiàng)高清晰度，高壓縮的技術(shù)得到了眾多硬件廠商的鐘愛(ài)，而市場(chǎng)上支持MPEG4技術(shù)的產(chǎn)品也是種類繁多。下面筆者就列舉一些代表性的產(chǎn)品，旨在讓讀者了解MPEG4技術(shù)在今天應(yīng)用范圍之廣。
   （1）、攝像機(jī)：日本夏普公司推出過(guò)應(yīng)用在互聯(lián)網(wǎng)上的數(shù)字?jǐn)z像機(jī)VN－EZ1。這臺(tái)網(wǎng)絡(luò)攝像機(jī)利用MPEG4格式，可把影像文件壓縮為ASF（高級(jí)流格式），用戶只要利用微軟公司的MediaPlayer播放程序，就可以直接在電腦上進(jìn)行播放。
   （2）、播放機(jī)：飛利浦公司于今年八月份推出了一款支持DivX的DVD播放機(jī)DVD737。它可以支持DivX 3.11、4.xx、5.xx等MPEG4標(biāo)準(zhǔn)，而對(duì)于新標(biāo)準(zhǔn)的支持則可以通過(guò)升級(jí)固件來(lái)實(shí)現(xiàn)。
   （3）、數(shù)碼相機(jī)：日本京瓷公司在11月中旬發(fā)售其最新款數(shù)碼相機(jī)Finecam L30，這款是采用300萬(wàn)像素、3倍光學(xué)變焦設(shè)計(jì)的數(shù)碼相機(jī)產(chǎn)品， L30采用了MPEG4格式動(dòng)態(tài)視頻錄制，可以讓動(dòng)態(tài)視頻錄制畫面效果比傳統(tǒng)數(shù)碼相機(jī)更出色。
   （4）、手機(jī)：在手機(jī)領(lǐng)域，MPEG4技術(shù)更是得到了廣泛的應(yīng)用，各大手機(jī)廠商也都推出了可拍攝MPEG4動(dòng)態(tài)視頻的手機(jī)型號(hào)，如西門子ST55、索尼愛(ài)立信P900/P908、LG 彩屏G8000等。
    (5)、MPEG4數(shù)字硬盤：在今年深圳舉行的安防展覽會(huì)上，開(kāi)發(fā)數(shù)字錄像監(jiān)控產(chǎn)品的廠家紛紛推出了他們的最新產(chǎn)品，而支持MPEG4的DVR壓縮技術(shù)也成為改展會(huì)上的亮點(diǎn)。
如北京華青紫博科技推出的"E眼神MPEG4數(shù)字視頻王"便是一款基于網(wǎng)絡(luò)環(huán)境的高清晰數(shù)字化監(jiān)控報(bào)警系統(tǒng)。內(nèi)置多畫面處理器，集現(xiàn)場(chǎng)監(jiān)控、監(jiān)聽(tīng)、多路同時(shí)數(shù)字錄像與回放等多種功能為一體。
    其實(shí)，市場(chǎng)上還有許多基于MPEG4技術(shù)的硬件產(chǎn)品，筆者這里就不一一列舉了，不過(guò)筆者相信，隨著視頻壓縮技術(shù)的不斷發(fā)展，MPEG4技術(shù)的產(chǎn)品會(huì)越來(lái)越多的出現(xiàn)在我們生活，工作中。

//from BBS 水木清華站 smth.org

xiaochongchong 發(fā)表于 >2004-12-28 17:01:26

[全文] [評(píng)論] [引用] [推薦] [檔案] [推給好友]

2004-12-23

蟲兒飛

蟲兒飛

黑黑的天空低垂
亮亮的繁星相隨
蟲兒飛蟲兒飛
你在思念誰(shuí)
天上的星星流淚
地上的玫瑰枯萎
冷風(fēng)吹冷風(fēng)吹
只要有你陪
蟲兒飛花兒睡
一雙又一對(duì)才美
不怕天黑只怕心碎
不管累不累
也不管東南西北

xiaochongchong 發(fā)表于 >2004-12-23 0:44:26

[全文] [評(píng)論] [引用] [推薦] [檔案] [推給好友]

2004-10-16

Some tips of C++ programming

//2004.7.14
(1).    float GetValue(void）；//良好風(fēng)格
        float GetValue()；     //不良風(fēng)格
(2).    如果參數(shù)是指針，且僅作輸入用，則應(yīng)在類型前加const，
        以防止該指針在函數(shù)體內(nèi)被任意修改。
        如：void StringCopy(char *strDestination, const char *strSource);
(3).    如果參數(shù)以值傳遞的方式傳遞對(duì)象，則宜改用“const &”方式來(lái)傳遞，這樣可以
        省去臨時(shí)對(duì)象的構(gòu)造和析構(gòu)過(guò)程，從而提高效率。
(4).    返回值時(shí)，不要將正常值和錯(cuò)誤標(biāo)志混在一起返回。正常值用輸出參數(shù)獲得，而
        錯(cuò)誤標(biāo)志用return語(yǔ)句返回。
        如：BOOL GetChar(char *c);
(5).    有時(shí)候函數(shù)原本不需要返回值，但為了增加靈活性如支持鏈?zhǔn)奖磉_(dá)，可以附加返回
值。如：char *strcpy(char *strDest, const char *strSrc);
        char str[20];
int length = strlen( strcpy(str, "Hello, world"

;
(6). 函數(shù)開(kāi)始使用assert斷言進(jìn)行正確性檢查。
(7). 使用free和delete釋放內(nèi)存后，指針值沒(méi)有變，應(yīng)及時(shí)將指針賦為NULL，
防止產(chǎn)生野指針。
(8). char *p = "hello"; //此時(shí)p指向常量字符串，位于靜態(tài)存儲(chǔ)區(qū)，它在程序
//生命周期內(nèi)恒定不變
p[0] = ‘X‘; //對(duì)常量進(jìn)行寫操作，而編譯器不會(huì)發(fā)現(xiàn)這個(gè)錯(cuò)誤
(9). char a[] = "hello, world";
char *p = a;
cout<< sizeof(a) << endl; //12字節(jié)
cout<< sizeof(p) << endl; //4字節(jié)
void Func(char a[100])
{
cout<< sizeof(a) <<endl;//4字節(jié)，當(dāng)數(shù)組作為函數(shù)參數(shù)傳遞，將自動(dòng)
//退化為同類型的指針
}
(10). 如果派生類的函數(shù)與基類的函數(shù)名相同，但參數(shù)不同。此時(shí)，無(wú)論有無(wú)virtual關(guān)鍵
字，基類的函數(shù)將被隱藏（注意別與重載混淆）。
如果派生類的函數(shù)與基類的函數(shù)名相同，并且參數(shù)也相同，但是基類函數(shù)沒(méi)有
virtual關(guān)鍵字。此時(shí)，基類的函數(shù)被隱藏（注意別與覆蓋混淆）。
如：
#include <iostream.h>
class Base
{
public:
virtual void f(float x){ cout << "Base::f(float)" << x << endl; }
void g(float x){ cout << "Base::g(float)" << x << endl; }
void h(float x){ cout << "Base::h(float)" << x << endl; }
};
class Derived : public Base
{
public:
virtual void f(float x){ cout << "Derived::f(float)" << x << endl; }
void g(int x){ cout << "Derived::g(float)" << x << endl; }
void h(float x){ cout << "Dervied::h(float)" << x << endl; }
};
void main(void)
{
Derived d;
Base *pb = &d;
Derived *pd = &d;
// Good : behavior depends solely on type of the object
pb->f(3.14f); // Derived::f(float) 3.14
pd->f(3.14f); // Derived::f(float) 3.14
// Bad : behavior depends on type of the pointer
pb->g(3.14f); // Base::g(float) 3.14
pd->g(3.14f); // Derived::g(int) 3 (surprise!)
// Bad : behavior depends on type of the pointer
pb->h(3.14f); // Base::h(float) 3.14 (surprise!)
pd->h(3.14f); // Derived::h(float) 3.14
}
(11). 派生類的構(gòu)造函數(shù)應(yīng)在其初始化表里調(diào)用基類的構(gòu)造函數(shù)。
(12). 基類與派生類的析構(gòu)函數(shù)應(yīng)該為虛（即加virtual關(guān)鍵字），這樣在調(diào)用派生類的
析構(gòu)函數(shù)時(shí)會(huì)調(diào)用基類的析構(gòu)函數(shù)。
(13). 在編寫派生類的賦值函數(shù)時(shí)，注意不要忘記對(duì)基類的數(shù)據(jù)成員重新賦值。例如：
class Base
{
public:
……
Base &operate =(const Base &other); //類Base的賦值函數(shù)
private:
int m_i, m_j, m_k;
};
class Derived : public Base
{
public:
……
Derived &operate =(const Derived &other);//類Derived的賦值函數(shù)
private:
int m_x, m_y, m_z;
};
Derived & Derived::operate =(const Derived &other)
{
//(1)檢查自賦值
if(this == &other)
return *this;
//(2)對(duì)基類的數(shù)據(jù)成員重新賦值
Base::operate =(other); //因?yàn)椴荒苤苯硬僮魉接袛?shù)據(jù)成員
//(3)對(duì)派生類的數(shù)據(jù)成員賦值
m_x = other.m_x;
m_y = other.m_y;
m_z = other.m_z;
//(4)返回本對(duì)象的引用
return *this;
}
(14). 嚴(yán)格的繼承規(guī)則：若在邏輯上B是A的“一種”，并且A的所有功能和屬性對(duì)B而言
都有意義，則允許B繼承A的功能和屬性。
(15). 組合規(guī)則：若在邏輯上A是B的“一部分”（a part of），則不允許B從A派生，
而是要用A和其它東西組合出B。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看