采樣和量化 Picture Element
Pixel(像素)(鏈接:
http://baike.baidu.com/view/575.htm)
采樣的實(shí)質(zhì)就是要用多少點(diǎn)(這個(gè)點(diǎn)我們叫像素)來(lái)描述一張圖像,比如,一幅420x570的圖像,就表示這幅圖像是由293400個(gè)點(diǎn)所組成。
量化是指要用多大范圍的數(shù)值,來(lái)表示圖像采樣之后每一個(gè)點(diǎn)的色彩信息。例如用3個(gè)bits存儲(chǔ)一個(gè)點(diǎn),表示該圖像只能用8種顏色來(lái)表現(xiàn)
多媒體數(shù)據(jù)的信息量舉例1
一頁(yè)印在B5(約180mm×255mm)紙上的文件,若以中等分辨率(300dpi)的掃描儀進(jìn)行采樣,其數(shù)據(jù)量約6.1Mb,一片650MB的CD-ROM,可存848頁(yè)。
1inch=25.4mm
圖像像素點(diǎn)的個(gè)數(shù)=(300×180)÷25.4×(300×255)÷25.4
每個(gè)像素點(diǎn)量化位為1bit/24bit.
黑白圖像文件大小=6403063×1÷1024÷1024=6.1Mb
真彩色圖像文件大小6403063×24÷1024÷1024=147Mb
多媒體數(shù)據(jù)的信息量舉例2
雙通道立體聲激光唱盤(CD-A),采樣頻率為44.1KHz,采樣精度(量化)16位/樣本。其一秒時(shí)間內(nèi)的采樣位數(shù)為1.35Mb/s,一個(gè)650Mb的CD-ROM,可存約1小時(shí)的音樂(lè)。
文件每秒存儲(chǔ)量(字節(jié)/秒)=采樣頻率(Hz)×采樣精度(位)×聲道數(shù)/8
44.1×10³×16×2÷8=176400B/s=1.35Mb/s
一個(gè)650Mb的CD-ROM可存音樂(lè):
650×8÷1.35÷60÷60=1.07H
多媒體數(shù)據(jù)壓縮的必要性
數(shù)字化后的信息,尤其是數(shù)字化后的視頻和音頻信號(hào)具有數(shù)據(jù)的海量性,它給信息的存儲(chǔ)和傳輸造成較大的困難,成為阻礙人類有效的獲取和使用信息的瓶頸問(wèn)題之一。
因此研究和開(kāi)發(fā)新興的有效的多媒體數(shù)據(jù)壓縮編碼方法,以壓縮的形式存儲(chǔ)和傳輸這些數(shù)據(jù)將是最好的選擇。
多媒體數(shù)據(jù)壓縮的可能性
信息量與數(shù)據(jù)量的關(guān)系:
I=D-du
I——信息量
D——數(shù)據(jù)量
du——冗余量
數(shù)據(jù)冗余是指信息所具有的各種性質(zhì)中多余的無(wú)用空間,其多余的冗余程度叫做“冗余度”。
圖像數(shù)據(jù)的冗余性
l 空間冗余 規(guī)則物體的表面具有物理相關(guān)性,將其表面數(shù)據(jù)化后表現(xiàn)為數(shù)據(jù)冗余。
l 時(shí)間冗余 視頻信號(hào)和動(dòng)畫一般為位于一時(shí)間區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過(guò)移動(dòng)物體所在的空間位置有所不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場(chǎng)景畫面。
l 結(jié)構(gòu)冗余 有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。例如方格狀的地板圖案等。我們稱此為結(jié)構(gòu)冗余。已知分布模式,可以通過(guò)某一過(guò)程生成圖像。
l 知識(shí)冗余 有些圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性,例如,人臉的圖像有固定的結(jié)構(gòu),這類規(guī)律性的結(jié)構(gòu),可有先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱此類冗余為知識(shí)冗余。根據(jù)已有的知識(shí),我們可以構(gòu)造其基本模型,并創(chuàng)建對(duì)應(yīng)各種特征的圖像庫(kù)。進(jìn)而圖像的存儲(chǔ)只需要保存一些特征參數(shù),從而可以大大減少數(shù)據(jù)量。知識(shí)冗余是模型編碼主要利用的特性。
l 視覺(jué)冗余 人類視覺(jué)系統(tǒng)對(duì)于圖像場(chǎng)的任何變化并不是都能感知的。
1. 人類視覺(jué)系統(tǒng)對(duì)亮度變化敏感,而對(duì)色度的變化相對(duì)不敏感。
2. 在高亮度區(qū),人眼多亮度變化敏感度下降。
3. 對(duì)物體邊緣敏感,內(nèi)部區(qū)域相對(duì)不敏感。
4. 對(duì)整體結(jié)構(gòu)敏感,而隊(duì)內(nèi)部細(xì)節(jié)相對(duì)不敏感。
數(shù)據(jù)壓縮的條件
l 信息冗余 冗余即是相同或相似信息的重復(fù)??梢栽诳臻g范圍重復(fù),也可以在時(shí)間范圍重復(fù),可以是嚴(yán)格重復(fù),也可以是以某種相似性重復(fù)。冗余分為統(tǒng)計(jì)冗余和心理視覺(jué)聽(tīng)覺(jué)冗余兩大類。
l 人類不敏感因素
對(duì)某些頻率的音頻信號(hào)不敏感;
人眼也存在“視覺(jué)掩蓋效應(yīng)”,即對(duì)亮度比較敏感,而對(duì)邊緣的強(qiáng)烈變化不敏感;并且對(duì)彩色細(xì)節(jié)的分辨能力遠(yuǎn)比亮度細(xì)節(jié)的分辨能力低。
數(shù)據(jù)壓縮與概率
數(shù)據(jù)壓縮是用編碼實(shí)現(xiàn)的
數(shù)據(jù)壓縮算法的理論基礎(chǔ)
傳統(tǒng)的壓縮編碼是建立在香農(nóng)(C.E.Shannon)信息論的基礎(chǔ)上,它以經(jīng)典的集合論為基礎(chǔ),用統(tǒng)計(jì)概率模型來(lái)描述信源,但是它未考慮信息接受者的主觀特性及事件本身的具體含義,重要程度和引起的后果。壓縮編碼的發(fā)展歷程實(shí)際是以香農(nóng)信息論為出發(fā)點(diǎn),不斷完善的過(guò)程。
常用壓縮編碼分類(鏈接:http://210.28.216.200/cai/dmtjishu/course4/course4-1.htm#nowhere)
(鏈接:http://cs.nju.edu.cn/yangxc/dcc2003.files/jszc-sub/jszc-043.html)
鏈接(http://jpkc.zust.edu.cn/2007/dmt/course/Mmt03_01_5.htm)
行程編碼算法
行程編碼(RLE,Run-length encoding)
原則: 重復(fù)的數(shù)據(jù)值序列(或稱為“流”)用一個(gè)重復(fù)次數(shù)和單個(gè)數(shù)據(jù)值來(lái)代替。
常用編碼格式
控制符 | 重復(fù)次數(shù) | 被重復(fù)對(duì)象 |
例如,字符串
RTAAAASDEEEEE
經(jīng)RLE壓縮后為:
RT*4ASD*5E
預(yù)測(cè)編碼原理
預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在著一定關(guān)聯(lián)性的特定,利用前面一個(gè)或多個(gè)信號(hào)預(yù)測(cè)下一個(gè)信號(hào)進(jìn)行,然后對(duì)實(shí)際值和預(yù)測(cè)值的差(預(yù)測(cè)誤差)進(jìn)行編碼。
壓縮評(píng)價(jià)指標(biāo)
衡量一種壓縮技術(shù)的三個(gè)重要指標(biāo)
l 壓縮比要大
l 恢復(fù)效果要好,要盡可能的恢復(fù)原始數(shù)據(jù)。
l 實(shí)現(xiàn)壓縮的算法要簡(jiǎn)單,壓縮解壓速度快,竟可能的做到實(shí)時(shí)壓縮、解壓。
從技術(shù)應(yīng)用目的評(píng)價(jià)壓縮指標(biāo)
l 面向存儲(chǔ)的技術(shù)
l 面向傳輸?shù)募夹g(shù)
多媒體數(shù)據(jù)壓縮編碼的國(guó)際標(biāo)準(zhǔn)
(鏈接:http://210.28.216.200/cai/dmtjishu/course4/course4-6.htm)
l 音頻編碼技術(shù)標(biāo)準(zhǔn):G系列標(biāo)準(zhǔn)
l JPEG,連續(xù)色調(diào)靜止圖像壓縮標(biāo)準(zhǔn)
l H.261,H.263,適用于ISDN上的會(huì)議電視/可視電話
l MPEG系列標(biāo)準(zhǔn)
運(yùn)動(dòng)圖像壓縮編碼標(biāo)準(zhǔn)MPEG
1. MPEG系列標(biāo)準(zhǔn)
MPEG專家小組承擔(dān)制定了可用于數(shù)字存儲(chǔ)介質(zhì)上的視頻及其關(guān)聯(lián)音頻的國(guó)際標(biāo)準(zhǔn)。
2MPEG1:著眼于解決多媒體的存儲(chǔ)問(wèn)題。
l 用于數(shù)據(jù)速率高達(dá)大約1.5Mbit/s的數(shù)字存儲(chǔ)媒體的活動(dòng)圖像和伴音編碼。
l 視頻數(shù)據(jù)壓縮率1/100-1/200,音頻壓縮率為1/6.5.
l MPEG1t提供每秒30幀352 *240分辨率的圖像。
MPEG-1音頻壓縮
MPEG-1音頻壓縮利用編碼技術(shù),將源文件重新進(jìn)行編碼壓縮,其次是利用數(shù)據(jù)壓縮,將人類聽(tīng)覺(jué)中的不敏感部分刪除,從而達(dá)到縮小文件尺寸的目的。音頻層根據(jù)壓縮質(zhì)量和編碼復(fù)雜度分為Layer 1 , Layer2 , Layer3三層
。
■MPEG-1Audio Layer3
ISDN聲音傳輸 1:10——1:12壓縮比 ■ MPEG-1Audio Layer2
數(shù)字廣播聲音、CD、
VCD、數(shù)字音樂(lè) 1:6——1:8壓縮比 ■ MPEG-1Audio Layer1
數(shù)字盒式磁帶 1:4壓縮比 ■Wave原始文件
聯(lián)系客服