多媒體測(cè)試庫(kù)建設(shè)之音頻部分 收藏
多媒體 測(cè)試庫(kù)建設(shè) 之音頻 部分
最近要為公司寫(xiě)多媒體式樣書(shū),并建立一個(gè)多媒體測(cè)試庫(kù),說(shuō)實(shí)話(huà)以前一直做codec,卻從沒(méi)有寫(xiě)過(guò)對(duì)整個(gè)一個(gè)產(chǎn)品的式樣書(shū),也不知道是否符合標(biāo)準(zhǔn)規(guī)范,現(xiàn)在把一些操作過(guò)程記錄下來(lái),如果有高人覺(jué)得不適合或者有誤的地方,還請(qǐng)多指點(diǎn)~~
先說(shuō)明一下我壓制測(cè)試文件 選擇編碼器的標(biāo)準(zhǔn):如果有官方提供的標(biāo)準(zhǔn)編碼器,就使用標(biāo)準(zhǔn)的編碼器,如果沒(méi)有就使用現(xiàn)在在壓制音視頻上比較廣泛使用的codec。
1、AMR
對(duì)MID而言,AMR的要求并不是很高,因?yàn)锳MR作為人聲編解碼相對(duì)來(lái)說(shuō)復(fù)雜度較低,沒(méi)有太多復(fù)雜而龐大的計(jì)算,所以AMR暫時(shí)就不作測(cè)試要求了,使用google 本身提供的codec就可以了。
2、MP3
現(xiàn)在比較廣泛使用的還是mpeg-1 layer |/II/III,在實(shí)際使用過(guò)程中發(fā)現(xiàn)mpeg-2 layer |/II/III還比較廣泛地作為著mp4,3gp的音頻壓縮格式,因此必須提供對(duì)mpeg-2的支持。對(duì)mpeg-1 layer ||/|||我使用的是開(kāi)源的編碼器lame,對(duì)mpeg-2 layer ||/|||也是使用的開(kāi)源編碼器twolame。另外所有的音頻源都是使用Audacity從FLAC文件中取得的,在重新采用和還原raw數(shù)據(jù)上我還使用了sox。
基本上整個(gè)編碼過(guò)程沒(méi)有朋到什么問(wèn)題,頭一次使用sox和Audacity,沒(méi)想到linux 還有這么強(qiáng)大的音頻處理工具~~值得推薦。
3、AAC
對(duì) AAC現(xiàn)在覺(jué)得只需要考慮對(duì)MPEG-4 AAC的支持,MPEG-2 AAC暫時(shí)不在考慮范圍之內(nèi)。在MID上必須支持AAC的全部3個(gè)profile : LC /HE /HEv2 。這里的編碼器選擇一般有兩個(gè):Nero AAC和Faac。Faac只支持LC,雖然介紹上說(shuō)還支持main,LTP等編碼模式,但在實(shí)際使用過(guò)程中發(fā)現(xiàn)好像并不支持。因此這次壓制的文件都是使用的Nero AAC,另外發(fā)現(xiàn)Nero AAC對(duì)于一些非工程規(guī)范的采用率好像不支持,因此在提供源數(shù)據(jù) 的時(shí)候盡量是標(biāo)準(zhǔn)工程采樣的數(shù)據(jù)。
4、wma/real audio/ac-3/dts
對(duì)這些的支持,我都是根據(jù)wiki以及官方協(xié)議 的版本來(lái)寫(xiě)的式樣書(shū),現(xiàn)在還沒(méi)有制作相關(guān)的測(cè)試文件
mp3 簡(jiǎn)介:
1、我們熟悉的MP3的全稱(chēng)是MPEG-1 Audio Layer III ,是一種有損音頻編碼格式,屬于MPEG-1 Audio部分。
2、實(shí)際上MPEG-1在Audio部分包含三個(gè)版本,分別是Audio Layer I/II/III ; Layer I已經(jīng)基本過(guò)時(shí)不用了,現(xiàn)在使用得比較多的是Layer II 和 Layer III, Layer II現(xiàn)在主要用在廣播上面,我們熟悉的VCD實(shí)際上也是采用的這種音頻編碼方式,而Layer III現(xiàn)在則廣泛應(yīng)用 在各方面。
3、另外MPEG-2對(duì)MPEG-1 Audio進(jìn)行了擴(kuò)展,這就是我們現(xiàn)在熟知的MPEG-2 Layer I/II/III, MPEG-2廣泛用在數(shù)字電視信號(hào)傳輸,衛(wèi)星廣播等各方面 ,我們熟知的DVD也是采用了MPEG-2的音視頻編碼方式。
4、還有一種MPEG-2.5,這只是一種私有格式,用得很少,提供了很高的壓縮率。
相關(guān)參數(shù):
MPEG-1 Layer I is defined in ISO/IEC 11172-3, which first version was published in 1993.
* Sampling rates: 32, 44.1 and 48 kHz
* Bitrates: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 and 448 kbit/s
An extension has been provided in MPEG-2 Layer I and is defined in ISO/IEC 13818-3, which first version was published in 1995.
* Additional sampling rates: 16, 22.05 and 24 kHz
* Additional bitrates: 48, 56, 80, 112, 144 and 176 kbit/s
MPEG-1 Layer II is defined in ISO/IEC 11172-3
* Sampling rates: 32, 44.1 and 48 kHz
* Bitrates: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 and 384 kbit/s
An extension has been provided in MPEG-2 Layer II and is defined in ISO/IEC 13818-3
* Additional sampling rates: 16, 22.05 and 24 kHz
* Additional bitrates: 8, 16, 24, 40 and 144 kbit/s
MPEG-1 layer III sample frequencies (kHz): 32 48 44.1
bitrates (kbps): 32 40 48 56 64 80 96 112 128 160 192 224 256 320
MPEG-2 layer III sample frequencies (kHz): 16 24 22.05
bitrates (kbps): 8 16 24 32 40 48 56 64 80 96 112 128 144 160
MPEG-2.5 layer III sample frequencies (kHz): 8 12 11.025
bitrates (kbps): 8 16 24 32 40 48 56 64
常見(jiàn)名詞:
VBR : Variable Bitrate Bit率是可變的
CBR : Constant Bitrate Bit率是固定的
ABR : Average Bitrate 平均Bit率,這是MP3的3種編碼的比特率模式
mono :?jiǎn)温暤?br>Dual channel : 雙聲道,每個(gè)聲道是比特率的一半,雙聲道不一定是立體聲 。
Stereo : 立體聲,包括兩個(gè)和兩個(gè)以上的聲道,每個(gè)聲道的碼率根據(jù)它所承載的信息量而定
Joint Stereo : 立體聲編碼的一種實(shí)現(xiàn)方式
Surround Audio : 環(huán)繞立體聲,一般包含六個(gè)以上的聲道
Sample Rate : 聲音編碼時(shí)候的采樣率,一般用Hz或者KHz為單位,即每秒里面采樣的Sample數(shù)
Sample Size : 每個(gè)采樣的深度,即每個(gè)采樣的bit數(shù)
Data encoding : 編碼以后的bit流順序,經(jīng)常用到的是floating-point
BitRate :這個(gè)是上面的這些參數(shù)的一個(gè)綜合反應(yīng),即每秒的bit數(shù)
Moving Picture Experts Group (acronym:MPEG) was formed by the ISO to set standards for audio and video compression and transmission
AAC簡(jiǎn)介
1、AAC全稱(chēng)Advanced Audio Coding,是一種有損的音頻編碼格式,更高范圍的采樣率(8khz-96khz)以及多音軌(up to 48)以及高性能的編碼效率,被譽(yù)為mp3的繼任者。
2、AAC的基礎(chǔ) 成形于MPEG-2 AAC,MPEG-4在MPEG-2的基礎(chǔ)上加入一些新的特性(比如SBR),就形成了MPEG-4的音頻標(biāo)準(zhǔn),定義為 MPEG-4 part3,我們一般所說(shuō)的AAC,都是指MPEG-4 AAC。
3、AAC有3個(gè)標(biāo)準(zhǔn),分別是LC[Low Complexity],He[high efficiency](add SBR),HeV2(add SBR and PS)。LC是基礎(chǔ)配置,SBR是頻帶復(fù)用技術(shù) ,而PS是參數(shù)立體聲,其中后面兩個(gè)標(biāo)注又稱(chēng)為 AAC Plus和AAC Plus V2。
4、AAC在編碼模塊上還使用到一些技術(shù),比如SRS,LTP等等。
相關(guān)參數(shù):
比特率:超過(guò)400kbps (mp3: 32-320kbps)
采樣率:8khz-96khz (mp3: 16khz-48khz)
常用名詞:
2 pass: 在編碼中使用的一項(xiàng)技術(shù),就是先對(duì)要編碼的文件進(jìn)行一次pass,觀(guān)察碼流的特性,保存下來(lái),第二次pass根據(jù)第一次的碼流特性進(jìn)行編碼,應(yīng)該來(lái)說(shuō)也間接實(shí)現(xiàn)了VBR。
聲道和音軌:音軌是一種錄音技術(shù),就是將不同的音樂(lè)錄制在不同的音軌上,然后將多個(gè)音軌合成一個(gè)聲道,或者一個(gè)立體聲音軌。聲道是衡量聲卡的一個(gè)性能指標(biāo),聲卡解析出文件的各個(gè)聲道然后送到各個(gè)音箱。可以把聲道理解成播放時(shí)候的音軌,因?yàn)槁暤赖脑?也是將各個(gè)聲道的數(shù)據(jù)送到音箱,從而呈現(xiàn)出一種聲音的立體感。
單軌和整軌:比如將一個(gè)CD壓制成一個(gè)APE文件,則就是整軌,而單軌就是將CD按曲目壓制成多個(gè)文件。
附:
1.1 MP3 Decode
Mp3 Decode 必須提供對(duì)Mpeg-1 layer I/II/III 以及Mpeg-2 layer I/II/III 標(biāo)準(zhǔn)的完整支持,對(duì)Mpeg-1 layer II/III 的優(yōu)先級(jí)最高,然后是Mpeg-2 layer II/III ,最后是Mpeg1/2 layer I 。
對(duì)以上規(guī)格下的各種Sampling rates 和Bitrates 的文件都能提供完整的解碼支持,并且能夠提供對(duì)VBR/CBR/ABR 以及Mono/Stereo/Joint Stereo/Surround 的解碼支持。
1.2 AAC Decode
AAC Decode 必須提供對(duì)Mpeg-4 Part 3 標(biāo)準(zhǔn)下LC/HE/HEv2 這3 個(gè)profile 的完整支持,對(duì)AAC LC 的優(yōu)先級(jí)最高,然后是AAC HE/HEv2 。
對(duì)以上規(guī)格下的8khz-96khz 采樣率以及400kbps 以上的比特率都能提供完整的解碼支持,并且能夠提供對(duì)VBR/CBR/ABR 以及Mono/Stereo/Joint Stereo/Surround 的解碼支持。
1.3 AMR
現(xiàn)階段對(duì)AMR-nb/wb 的codec 沒(méi)有什么特別的要求,使用Google 自帶的codec 即可,將來(lái)如果有特別的需要將會(huì)以補(bǔ)充要求的方式提供。
1.4 WMA Decode
Wma Decode 必須提供對(duì)Microsoft WMA 和WMA professional 的完整支持,其中WMA1/2 的優(yōu)先級(jí)最高,其次是WMA pro 。
1.5 Real Audio Decode
Real Audio Decode 必須提供對(duì)Real Audio 1-10 的完整支持,支持RDT 協(xié)議以實(shí)現(xiàn)流媒體的在線(xiàn)播放。
1.6 AC-3 Decode
AC-3 Decode 必須提供對(duì)Dolby Digital EX 和Dolby Digital Surround EX 規(guī)格的完整支持。