自從PC支持多媒體以來(lái),陸陸續(xù)續(xù)地出現(xiàn)了許多音頻格式。這些格式既有流行的也有不那么流行的,關(guān)于它們的來(lái)龍去脈,本文向你一一道來(lái)。
主流
目前的主流音頻格式其實(shí)不少。不同的格式有自己的用途,比如大家都應(yīng)該很熟悉的MP3格式就是用于聆聽(tīng)用途的。下面我們逐一介紹:
存在便是永恒 - WAV
WAV是Microsoft Windows本身提供的音頻格式,由于Windows本身的影響力,這個(gè)格式已經(jīng)成為了事實(shí)上的通用音頻格式。不客氣地說(shuō),它實(shí)際上是Apple電腦的 AIFF格式的克隆。通常我們使用WAV格式都是用來(lái)保存一些沒(méi)有壓縮的音頻,但實(shí)際上WAV格式的設(shè)計(jì)是非常靈活(非常復(fù)雜)的,該格式本身與任何媒體數(shù)據(jù)都不沖突,換句話說(shuō),只要有軟件支持,你甚至可以在WAV格式里面存放圖像。之所以能這樣,是因?yàn)閃AV文件里面存放的每一塊數(shù)據(jù)都有自己獨(dú)立的標(biāo)識(shí),通過(guò)這些標(biāo)識(shí)可以告訴用戶究竟這是什么數(shù)據(jù)。在WINDOWS平臺(tái)上通過(guò)ACM(Audio Compression Manager)結(jié)構(gòu)及相應(yīng)的驅(qū)動(dòng)程序(在這里通常稱為CODEC,編碼/解碼器),可以在WAV文件中存放超過(guò)20種的壓縮格式,比如ADPCM、 GSM、CCITT G.711、G.723等等,當(dāng)然也包括MP3格式。
圖表 - 使用音頻編輯軟件WaveCN(
http://www.wavecn.com)列出Windows安裝了的ACM驅(qū)動(dòng)信息
雖然WAV文件可以存放壓縮音頻甚至mp3,但由于它本身的結(jié)構(gòu)注定了它的用途是存放音頻數(shù)據(jù)并用作進(jìn)一步的處理,而不是像mp3那樣用于聆聽(tīng)。目前所有的音頻播放軟件和編輯軟件都支持這一格式,并將該格式作為默認(rèn)文件保存格式之一。這些軟件包括:Sound Forge, Cool Edit Pro, WaveLab等等。由于WAV的支持實(shí)在是太廣泛了,可以說(shuō),即使Windows退出歷史舞臺(tái),WAV格式也不會(huì)消亡。
老當(dāng)益壯 – mp3
第二個(gè)要提到的就是改變了世界的mp3了。這個(gè)比喻相信大家都會(huì)同意。mp3是Fraunhofer-IIS 研究所(
http://www.iis.fhg.de/)的研究成果。mp3是第一個(gè)實(shí)用的有損音頻壓縮編碼。在mp3出現(xiàn)之前,一般的音頻編碼即使以有損方式進(jìn)行壓縮能達(dá)到4:1的壓縮比例已經(jīng)非常不錯(cuò)了。但是,mp3可以實(shí)現(xiàn)12:1的壓縮比例,這使得mp3迅速地流行起來(lái)。mp3之所以能夠達(dá)到如此高的壓縮比例同時(shí)又能保持相當(dāng)不錯(cuò)的音質(zhì)是因?yàn)槔昧酥X(jué)音頻編碼技術(shù),也就是利用了人耳的特性,削減音樂(lè)中人耳聽(tīng)不到的成分,同時(shí)嘗試盡可能地維持原來(lái)的聲音質(zhì)量。
圖表 - 人耳等響度曲線圖,mp3的技術(shù)基礎(chǔ)。
衡量mp3文件的壓縮比例通常使用比特率來(lái)表示。這個(gè)術(shù)語(yǔ)的英文是bps: bit per second,表示每1秒鐘的音頻可以用多少個(gè)二進(jìn)制比特來(lái)表示。通常比特率越高,壓縮文件就越大,但音樂(lè)中獲得保留的成分就越多,音質(zhì)就越好。由于比特率與文件大小音質(zhì)的關(guān)系,所以后來(lái)又出現(xiàn)了vbr(Variant Bitrate 可變比特率)方式編碼的mp3,這種編碼方式的特點(diǎn)是可以根據(jù)編碼的內(nèi)容動(dòng)態(tài)地選擇合適的比特率,因此編碼的結(jié)果是在保證了音質(zhì)的同時(shí)又照顧了文件的大小,結(jié)果大受歡迎。其實(shí)mp3的編碼標(biāo)準(zhǔn)本來(lái)就支持這種壓縮方式,但是第一個(gè)將此功能實(shí)現(xiàn)的反而是一個(gè)第三方工具:曾經(jīng)非常有名的Xing Technology公司(
http://www.xingtech.com,當(dāng)年很多電腦上看VCD聽(tīng)mp3就靠這個(gè)公司的Xing Player)推出的Xing Encoder。
由于mp3是世界上第一個(gè)有損壓縮的編碼方案,所以可以說(shuō)所有的播放軟件都支持它,否則就根本沒(méi)有生命力。在制作方面,也曾經(jīng)產(chǎn)生了許多第三方的編碼工具。不過(guò)隨著后來(lái)Fraunhofer-IIS宣布對(duì)編碼器征收版稅之后很多都消失了。目前屬于開(kāi)放源代碼并且免費(fèi)的編碼器是LAME (Lame Ain‘t Mp3 Encoder,
http://lame.sourceforge.net)。這個(gè)工具是公認(rèn)的壓縮音質(zhì)最好的mp3壓縮工具。另外,幾乎所有的音頻編輯工具都支持打開(kāi)和保存mp3文件。最近,F(xiàn)raunhofer-IIS對(duì)之前不收取版權(quán)費(fèi)的mp3解碼器也征收了版權(quán)費(fèi)。此舉大有Fraunhofer-IIS意識(shí)到mp3已經(jīng)在沒(méi)落,趁還能收到錢最后撈一把的意思。應(yīng)該說(shuō),到了現(xiàn)在,MP3確實(shí)顯現(xiàn)出疲態(tài)了。許多新一代的編碼技術(shù)都已經(jīng)能在相同的比特率下提供比MP3優(yōu)越得多的音質(zhì)。特別是音樂(lè)發(fā)燒友對(duì)mp3的音質(zhì)更是嗤之以鼻。不過(guò)由于mp3的影響力實(shí)在是太大了,支持mp3的軟件多如牛毛,更別提眾多支持mp3的硬件播放器,如MPMAN,DiscMan, CD/VCD/DVD機(jī)等等。一句話,它依然是世界上最流行的音頻壓縮技術(shù),所以要它真正退出舞臺(tái)相信還有好一段時(shí)間。
圖表 - Lame的其中一個(gè)前端:RazorLame(
http://www.dors.de/razorlame)
老樹(shù)發(fā)新花 - mp3PRO
為了使mp3能在未來(lái)仍然保持生命力,F(xiàn)raunhofer-IIS研究所連同Coding Technologies 公司(
http://www.codingtechnologies.com)還有法國(guó)的Thomson multimedia公司(
http://www.thomson.net)共同推出了mp3PRO。這種格式與之前的mp3相比最大的特點(diǎn)是能在低達(dá)64kbps的比特率下仍然能提供近似CD的音質(zhì)(mp3是128K)。該技術(shù)稱為SBR(Spectral Band Replication),它在原來(lái)mp3技術(shù)的基礎(chǔ)上專門針對(duì)原來(lái)mp3技術(shù)中損失了的音頻細(xì)節(jié)進(jìn)行獨(dú)立編碼處理并捆綁在原來(lái)的mp3數(shù)據(jù)上,在播放的時(shí)候通過(guò)再合成而達(dá)到良好的音質(zhì)效果。
圖表 - SBR技術(shù)在音頻編碼/解碼過(guò)程中的應(yīng)用
mp3PRO格式與mp3是兼容的,所以它的文件類型也是mp3。mp3PRO播放器可以支持播放 mp3PRO或者mp3編碼的文件;普通的mp3播放器也可以支持播放mp3PRO編碼的文件,但只能播放出mp3的音質(zhì)。但是,雖然mp3PRO是一種優(yōu)秀的技術(shù),由于技術(shù)專利費(fèi)用的問(wèn)題以及其他技術(shù)提供商比如Microsoft的競(jìng)爭(zhēng),mp3PRO并沒(méi)有得到很大的流行。大家可以從Coding Technologies的網(wǎng)站下載Demo播放/壓縮工具和Winamp的播放插件。目前也有許多專業(yè)音頻編輯軟件比如Cool Edit Pro 2.0支持mp3PRO格式,但播放器除了剛才說(shuō)的和Music Match Juke Box就基本沒(méi)有了。最關(guān)鍵的是由于Microsoft的媒體播放機(jī)不支持,使得mp3PRO失去了流行的機(jī)會(huì)。前段時(shí)間Coding Technologies推出了最新的MPEG-4 aacPlus,通過(guò)將SBR技術(shù)應(yīng)用在AAC(Advanced Audio Codec)技術(shù)中而獲得更卓越的音質(zhì)。Coding Technologies并表示SBR將會(huì)成為MPEG-4的核心技術(shù)。但缺乏支持的技術(shù)到底能走多遠(yuǎn),誰(shuí)也不清楚。
圖表 - THOMSON mp3PRO 播放器
網(wǎng)絡(luò)流媒體鼻祖 - Real Media
互聯(lián)網(wǎng)大行其道之后,Real Media 出現(xiàn)了。這種文件格式幾乎成了網(wǎng)絡(luò)流媒體的代名詞。RA、RMA這兩個(gè)文件類型就是Real Media里面向音頻方面的。它是由Real Networks公司(
http://www.realnetworks.com)發(fā)明的,特點(diǎn)是可以在非常低的帶寬下(低達(dá)28.8kbps)提供足夠好的音質(zhì)讓用戶能在線聆聽(tīng)。這一特點(diǎn)在互聯(lián)網(wǎng)的早期簡(jiǎn)直是廣大網(wǎng)蟲(chóng)的福音。也就是因?yàn)槌霈F(xiàn)了Real Media之后,相關(guān)的應(yīng)用比如網(wǎng)絡(luò)廣播,網(wǎng)上教學(xué),網(wǎng)上點(diǎn)播等等才浮出水面,形成了一個(gè)新的行業(yè)。
網(wǎng)絡(luò)流媒體的道理其實(shí)非常簡(jiǎn)單,簡(jiǎn)單說(shuō)就是將原來(lái)連續(xù)不斷的音頻分割成一個(gè)一個(gè)帶有順序標(biāo)記的小數(shù)據(jù)包,將這些小數(shù)據(jù)包通過(guò)網(wǎng)絡(luò)進(jìn)行傳遞,在接收的時(shí)候再將這些數(shù)據(jù)包重新按順序組織起來(lái)播放。如果網(wǎng)絡(luò)質(zhì)量太差,有些數(shù)據(jù)包收不到或者延緩了到達(dá),它就跳過(guò)這些數(shù)據(jù)包不播放,以保證用戶在聆聽(tīng)的內(nèi)容是基本連續(xù)的。就是這么簡(jiǎn)單的道理,促成了網(wǎng)絡(luò)上的又一個(gè)傳奇。
由于Real Media是從極差的網(wǎng)絡(luò)環(huán)境下發(fā)展過(guò)來(lái)的,所以Real Media的音質(zhì)并不怎樣,包括在高比特率的時(shí)候,甚至差于mp3。特別是有相當(dāng)長(zhǎng)的一段時(shí)間Real Networks公司只顧著往Real Media里面加入各種各樣的新特性比如廣告插播什么的,而忽略了隨著網(wǎng)絡(luò)速度的提升和寬帶網(wǎng)的普及,用戶對(duì)質(zhì)量的要求也不斷提高。后來(lái)Real Networks通過(guò)與SONY公司合作,利用SONY的ATRAC技術(shù)(
http://www.minidisc.org/,也就是MD的壓縮技術(shù))實(shí)現(xiàn)高比特率的高保真壓縮,但這些舉措始終都帶給用戶一個(gè)姍姍來(lái)遲的感覺(jué)。由于Real Media的用途是在線聆聽(tīng),并不適于編輯,所以相應(yīng)的處理軟件并不多。一些主流軟件可以支持Real Media的讀/寫,可以實(shí)現(xiàn)直接剪輯的軟件是Real Networks自己提供的捆綁在Real Media Encoder編碼器中的Real Media Editor。但功能非常有限。這一點(diǎn)與現(xiàn)在的Windows Media相比是兩個(gè)世界。
圖表 - Real One Player, 最新的Real Media播放器
霸氣十足 - Windows Media
任何事情都少不了Microsoft的份。在意識(shí)到網(wǎng)絡(luò)流媒體之于互聯(lián)網(wǎng)的重要性之后,Microsoft立馬就推出了Windows Media與Real Media相抗衡,同時(shí)開(kāi)始對(duì)其他音頻壓縮技術(shù)說(shuō)不:一律不提供直接支持。到了Windows XP版本還把原來(lái)提供的mp3壓縮功能都拿掉了。
Windows Media (
http://www.microsoft.com/windows/windowsmedia)也是一種網(wǎng)絡(luò)流媒體技術(shù),本質(zhì)上跟Real Media是相同的。但Real Media是有限開(kāi)放的技術(shù),比如rtsp(Real Time Stream Protocol實(shí)時(shí)流協(xié)議)這樣的網(wǎng)絡(luò)傳輸協(xié)議是提交到網(wǎng)絡(luò)工作組RFC網(wǎng)絡(luò)協(xié)議集的其中一個(gè)(編號(hào)RFC2326),而Windows Media則沒(méi)有公開(kāi)任何技術(shù)細(xì)節(jié),據(jù)稱是為了更好地進(jìn)行版權(quán)保護(hù),因此要完全封閉,還創(chuàng)造出一種名為mms(Multi-Media Stream多媒體流)的傳輸協(xié)議。所有這些事情綜合起來(lái)可以看出Microsoft意圖一統(tǒng)江湖的野心。
最初版本的Windows Media并沒(méi)有得到什么好評(píng),特別在音質(zhì)方面更被網(wǎng)絡(luò)上那些“金耳朵”的網(wǎng)友所不齒。不過(guò)在更新了幾個(gè)版本之后,目前最新的Windows Media 9技術(shù)攜帶著大量的新特性并在Windows Media Player的配合下表現(xiàn)已經(jīng)不可同日而語(yǔ)。特別在音頻方面,Microsoft是唯一一個(gè)能提供全部種類音頻壓縮技術(shù)(無(wú)失真、有失真、語(yǔ)音)的解決方案,大有囊括一切的勢(shì)頭。這也是微軟的一貫特色:雖然我的東西質(zhì)量不是最好的,但肯定是最方便,集成度最高的。目前Windows Media還是處于推廣期,播放器和編碼器可以免費(fèi)下載,服務(wù)器端捆綁在Windows服務(wù)器版中,不另外收費(fèi)。這些手段正在不斷提升其市場(chǎng)占有率。而且由于Microsoft的影響力,支持Windows Media的軟件非常多。雖然它也是用于聆聽(tīng)用途,不能編輯,但幾乎所有的Windows平臺(tái)的音頻編輯工具都對(duì)它提供了讀/寫支持,至于第三方播放器更是無(wú)一例外了,連Real Player都支持其播放。通過(guò)Microsoft 自己推出的Windows Media File Editor可以實(shí)現(xiàn)簡(jiǎn)單的直接剪輯。最近,Microsoft還推出了Windows XP Media Center版本,通過(guò)在Windows XP中捆綁Windows Media 9技術(shù)以及相關(guān)娛樂(lè)媒體軟件來(lái)加強(qiáng)Windows作為家庭娛樂(lè)中心的作用。如果Microsoft繼續(xù)保持其在操作系統(tǒng)特別是桌面操作系統(tǒng)的壟斷地位的話,Windows Media的未來(lái)肯定是一片光輝。
圖表 - 最新的Windows Media Player 9,帶有大量的網(wǎng)絡(luò)特性
電腦與電子樂(lè)器的橋梁 – MIDI
MIDI技術(shù)本來(lái)不是為了電腦發(fā)明的。該技術(shù)最初應(yīng)用在電子樂(lè)器上用來(lái)記錄樂(lè)手的彈奏,以便以后重播。不過(guò)隨著在電腦里面引入了支持MIDI合成的聲音卡之后MIDI才正式地成為了一種音頻格式。有很多人都誤以為MIDI是用來(lái)記譜的,這是錯(cuò)的。MIDI的內(nèi)容除了樂(lè)譜之外還記錄了每個(gè)音符的彈奏方法,所以有些MIDI文件播放起來(lái)不好聽(tīng),而某些則有良好的效果。MIDI本身也有兩個(gè)版本,General MIDI和General MIDI 2。在MIDI上還衍生了許多第三方的非標(biāo)準(zhǔn)技術(shù),比如非常著名的:X-MIDI(或者叫XG),這是由日本YAMAHA公司(
http://www.yamaha.com)發(fā)明的,在原有的MIDI具有128種樂(lè)器的基礎(chǔ)上擴(kuò)充到了512種,并增加了更多的演奏控制,配合YAMAHA自己的波表播放軟件或支持X-MIDI的硬件可以還原出非常動(dòng)聽(tīng)和接近真實(shí)樂(lè)器效果的音樂(lè)。另外就是為了彌補(bǔ)MIDI中通過(guò)聲音合成得到的樂(lè)器聲音始終比不上真實(shí)樂(lè)器聲音這一缺點(diǎn)而由 General MIDI Association(MIDI規(guī)范的國(guó)際組織,
http://www.midi.org)推出的DLS(Downloadable Sound)技術(shù),該技術(shù)通過(guò)給MIDI文件附帶上真實(shí)樂(lè)器的錄音(采樣)而使MIDI文件能營(yíng)造出接近真實(shí)樂(lè)器效果的聲音,不過(guò)該技術(shù)的主要問(wèn)題是帶上樂(lè)器采樣之后的MIDI文件實(shí)在是太大了,通常情況下都有4兆字節(jié)以上(這樣的大小用戶當(dāng)然是去找mp3了),影響了該技術(shù)的普及。
由于MIDI具有的優(yōu)點(diǎn)和特殊性,因此可以相信這是一種在相當(dāng)長(zhǎng)的時(shí)間里都會(huì)繼續(xù)存在的技術(shù)。普通的MIDI 文件許多播放器都支持,但要達(dá)到好的效果就必須安裝軟波表,比如曾經(jīng)很出名的WinGroove、Roland Virtual Sound Canvas和YAMAHA S-YXG Player。隨著Microsoft與Roland(
http://www.roland.com)合作在DirectX里面增加了 DirectMusic之后軟波表就變成了Windows系統(tǒng)的標(biāo)準(zhǔn)配置了。需要注意的是對(duì)于X-MIDI格式來(lái)說(shuō)必須使用YAMAHA自己推出的播放器才能得到良好的播放效果。比如當(dāng)年曾經(jīng)賣得很火的使用YAMAHA YMF724/740做芯片的聲音卡便帶有X-MIDI的播放器S-YXG100。
圖表 - Roland Virtual SoundCanvas軟音源界面
圖表 - YAMAHA S-YXG50軟音源播放器界面,怎么看都覺(jué)得比Roland的好看。
圖表 - YAMAHA S-YXG50 XGPlayer軟音源播放器界面,這個(gè)版本支持的播放控制更多。
如果要對(duì)MIDI文件進(jìn)行編輯,可以使用的比較出名的軟件是Cake Walk Pro和Sonar(
http://www.cakewalk.com); X-MIDI則要使用YAMAHA XGWorks。另外還有一些曲譜軟件,比如Sibelius(
http://www.sibelius.com)。不過(guò)這些軟件都是非常昂貴的。國(guó)產(chǎn)的相關(guān)軟件都有一些,而且支持簡(jiǎn)譜,比如TT作曲家(
http://www.centrmus.com)。
開(kāi)放、免費(fèi) - Ogg Vorbis
開(kāi)放源代碼的Ogg Vorbis(
http://www.xiph.org 或
http://www.vorbis.com),作為開(kāi)放源碼向?qū)@夹g(shù)下的第一封戰(zhàn)書出現(xiàn)在世人的面前。在經(jīng)歷了一些變故之后,Ogg Vorbis終于在2002年7月釋出了1.0版本。由于開(kāi)放源碼的東西向來(lái)都缺少槍手為其搖旗吶喊,所以國(guó)內(nèi)并不是有很多的人了解Ogg Vorbis。Ogg Vorbis 是一種音頻壓縮格式,類似于MP3等現(xiàn)有的通過(guò)有損壓縮算法進(jìn)行音頻壓縮的音樂(lè)格式。但有一點(diǎn)不同的是,Ogg Vorbis格式是完全免費(fèi)、開(kāi)放源碼且沒(méi)有專利限制的。Vorbis 是這種音頻壓縮機(jī)制的名字,而Ogg則是一個(gè)計(jì)劃的名字,該計(jì)劃意圖設(shè)計(jì)一個(gè)完全開(kāi)放源碼的多媒體系統(tǒng)。開(kāi)放源代碼能為用戶在經(jīng)濟(jì)上帶來(lái)收益,這一點(diǎn)很多人都知道了,但不能忘記的是Ogg Vorbis的技術(shù)也不是蓋的。Ogg Vorbis文件的擴(kuò)展名是.OGG。這種文件的設(shè)計(jì)格式是非常靈活的。它的最大特點(diǎn)是在文件格式已經(jīng)固定下來(lái)后還能對(duì)音質(zhì)進(jìn)行明顯的調(diào)節(jié)和新算法?,F(xiàn)在創(chuàng)建的OGG文件可以在未來(lái)的任何播放器上播放,因此,這種文件格式可以不斷地進(jìn)行大小和音質(zhì)的改良,而不影響舊有的編碼器或播放器。在壓縮技術(shù)上, Ogg Vorbis的最主要特點(diǎn)是使用了VBR(可變比特率)和ABR(平均比特率)方式進(jìn)行編碼。與MP3的CBR(固定比特率)相比可以達(dá)到更好的音質(zhì)。 Ogg Vorbis其他技術(shù)特性還包括:支持類似于MP3的ID3信息,但比MP3要靈活而又完整得多,實(shí)際上可以填寫隨意多的信息。Vorbis還具有比特率縮放功能,可以不用重新編碼便可調(diào)節(jié)文件的比特率。Vorbis文件可以被分成小塊并以樣本粒度(granularity,專業(yè)術(shù)語(yǔ),指數(shù)據(jù)可以被分割的最小尺寸)進(jìn)行編輯;Vorbis支持多通道(大于2)音頻流并使用了獨(dú)創(chuàng)性的處理技術(shù);Vorbis文件可以以邏輯方式相連接等。
在經(jīng)濟(jì)利益的推動(dòng)下,Ogg Vorbis從一誕生就獲得了各方的關(guān)注,許多著名音頻軟件,包括象出品Sound Forge的Sonic Foundry(
http://www.sonicfoundry.com)這樣的工業(yè)巨頭也在軟件中增加了對(duì)Ogg Vorbis的支持,而對(duì)于本來(lái)就是免費(fèi)的或者開(kāi)放源碼的音頻相關(guān)軟件比如WinAMP(
http://www.winamp.com)、CDEX(
http://cdex.sourceforge.net)等等更是第一時(shí)間在軟件中加入了Ogg Vorbis的支持??梢赃@樣說(shuō),Ogg Vorbis在業(yè)界的支持是非常廣泛的。簡(jiǎn)單的舉個(gè)例子,著名的游戲閃點(diǎn)行動(dòng)(Operation Flash Point)就是使用Ogg Vorbis作為游戲所有聲音和音樂(lè)的保存格式的。
當(dāng)然,軟件上的支持對(duì)于一種音樂(lè)格式來(lái)說(shuō)還是一廂情愿的事情。Ogg Vorbis是否能夠真正流行起來(lái),關(guān)鍵還是要靠廣大用戶和音樂(lè)制作人??上驳氖牵壳霸诰W(wǎng)絡(luò)上Ogg Vorbis格式的應(yīng)用已經(jīng)日漸增多,而且已經(jīng)開(kāi)始向其他方面發(fā)展,比如游戲、多媒體應(yīng)用的配樂(lè)等。目前Ogg Vorbis取得的最大成就是獲得著名的BBC廣播公司的認(rèn)可,使用Ogg Vorbis音頻流在線播放節(jié)目。另外,在硬件方面也出現(xiàn)了支持播放OGG格式的播放器。
Ogg Vorbis幾乎得到所有的音頻編輯器的支持。另外,作為一般的編碼使用,可以在
http://www.vorbis.com/download_win.psp網(wǎng)址可以下載到OggDrop/OggDrop XPd。播放可以使用WinAMP播放?,F(xiàn)在Ogg Vorbis已經(jīng)是WinAMP標(biāo)準(zhǔn)配置之一。
圖表 - OggDrop XPd, Ogg Vorbis的編碼器
生不逢時(shí) – VQF
VQF實(shí)際指的是TwinVQ(Transform-domain Weighted INterleave Vector Quantization)技術(shù),是日本Nippon Telegraph and Telephone集團(tuán)屬下的NTT Human Interface Laboratories(
http://sound.splab.ecl.ntt.co.jp)開(kāi)發(fā)的一種音頻壓縮技術(shù)。該技術(shù)受到著名的YAMAHA公司的支持。VQF或TVQ是其文件的文件類型名。VQF其實(shí)是一種比較先進(jìn)的技術(shù),通常認(rèn)為 96kbps VQF 與 128kbps MP3 質(zhì)量相同。下圖是MP3與VQF的一個(gè)質(zhì)量對(duì)比示意圖:
MP3 128Kbps
Original 1411Kpbs
VQF 96Kbps
雖然說(shuō)質(zhì)量相同,但由于VQF使用的是不同的技術(shù),從這個(gè)圖上大家應(yīng)該可以感受到兩者的差別。
VQF在YAMAHA公司的大力推動(dòng)下也曾有相當(dāng)?shù)氖袌?chǎng)份額。不過(guò)時(shí)至今日,VQF已經(jīng)在逐步淡出舞臺(tái)。原因是多方面的。首先,VQF 是專門開(kāi)發(fā)來(lái)用于低比特率情況的,對(duì)于錄音室這種需要高保真的環(huán)境就無(wú)能為力了。換句話說(shuō),VQF僅適合一般播放用途。這使得VQF的應(yīng)用范圍相對(duì)狹窄。其次,VQF沒(méi)有得到操作系統(tǒng)平臺(tái)的直接支持,就像mp3PRO那樣,Windows自始至終都不支持直接播放VQF文件,使得VQF得不到大范圍的推廣。再次,VQF是一種封閉的專利技術(shù),導(dǎo)致市場(chǎng)所有與VQF相關(guān)的編碼器、播放器無(wú)一不是YAMAHA和NTT的產(chǎn)物,這一點(diǎn)極大地妨礙了VQF的發(fā)展。最著名的一個(gè)例子就是一個(gè)曾經(jīng)致力于推廣VQF技術(shù)的網(wǎng)站:
http://www.vqf.com宣布由于VQF的衰落而停止更新,等待高比特率 (192kbps或以上)的VQF格式出臺(tái)后再作打算。雖然YAMAHA公司已經(jīng)成功地將VQF提交到了MPEG組織,并成為MPEG-4標(biāo)準(zhǔn)的一部分,但這些努力也是無(wú)濟(jì)于事的。因?yàn)镸PEG-4本來(lái)就是一個(gè)面向?qū)ο蟮拇蟀莸钠脚_(tái),與MPEG-1和MPEG-2這樣專門針對(duì)某種具體的技術(shù)而制定的標(biāo)準(zhǔn)已經(jīng)不是一回事了。
要播放VQF軟件,可以通過(guò)給WinAMP增加支持插件來(lái)實(shí)現(xiàn),也可以使用YAMAHA自己的SoundVQ Player播放器。編碼軟件可以使用YAMAHA SoundVQ Encoder或者NTT TwinVQ Encoder。后者的優(yōu)化比較好,速度比前者快一些。
圖表 - TwinVQ 編碼器,非常簡(jiǎn)單的界面。
非主流
最熱門的非主流 - MOD
Module(簡(jiǎn)稱mod)是數(shù)碼音樂(lè)文件,由一組samples(樂(lè)器的聲音采樣)、曲譜和時(shí)序信息組成,告訴一個(gè)mod播放器何時(shí)以何種音高去演奏在某條音軌的某個(gè)樣本,附帶演奏一些效果比如顫音等。因而mod與純正的象WAV或AU那樣的沒(méi)有包含時(shí)序信息的樣本文件不同,與象MIDI文件那樣的不攜帶任何附加樣本/樂(lè)器的文件也不同(與現(xiàn)在支持DLS技術(shù)的MIDI倒是有點(diǎn)相似,不過(guò)mod的體積要比 DLS MIDI小得多。)。mod起源于Amiga計(jì)算機(jī),當(dāng)時(shí)的文件擴(kuò)展名是MOD,為了區(qū)分具體的類型和整個(gè)結(jié)構(gòu)體系,通常使用mod來(lái)表示整個(gè) Module格式體系。由于該格式起源很早,因此曾經(jīng)非常流行,因?yàn)閙od提供了一種具有可以接受的音質(zhì)水平而又非常廉價(jià)的制作音樂(lè)的方法。而且這種文件的音質(zhì)效果對(duì)于當(dāng)時(shí)的電腦硬件水平來(lái)說(shuō)效果比MIDI要好,文件的體積也不大,好處是輕而易見(jiàn)的。隨著高質(zhì)量的音響硬件的使用,新一代的mod的聲音質(zhì)量甚至可以提升到接近專業(yè)設(shè)備的水平。這使得mod成為一種介乎于象WAV或VOC那樣的純正樣本數(shù)據(jù)文件和象General MIDI那樣的純正時(shí)序信息文件之間的混合體,成為一種比較靈活的音頻格式。
但是,mod的最大缺點(diǎn)是具體的格式變化太多。由于原本的MOD格式只支持4條音軌,而且MOD格式并沒(méi)有版權(quán)限制,導(dǎo)致后來(lái)涌現(xiàn)了一大堆在MOD的基礎(chǔ)上改進(jìn)而來(lái)的格式,比如xm這種支持高達(dá)32條音軌128種采樣的格式。但由于mod格式的不統(tǒng)一,最終結(jié)果就是這種格式在商業(yè)領(lǐng)域沒(méi)有多大的作為。Windows平臺(tái)上曾經(jīng)有一個(gè)非常好的播放器名為MOD4WIN,后來(lái)也停止了開(kāi)發(fā)。目前支持播放Mod的播放器主要有WinAMP,比較新的制作軟件則有Sk@le Tracker(
http://www.skale.org),是一個(gè)免費(fèi)的軟件。大家如果對(duì)這種格式產(chǎn)生興趣的話可以到
http://www.modplug.com 看看,這里是最齊全的關(guān)于mod的站點(diǎn)。
圖表 - 非常華麗的Sk@le Tracker,目前還是0.75Beta版本
圖表 - 同樣有著不錯(cuò)界面的MOD4WIN的最后版本,也是免費(fèi)軟件。
一個(gè)也不能少 - Monkey‘s audio
Monkey‘s Audio(
http://www.monkeysaudio.com)是一種無(wú)損壓縮技術(shù)。他并不是由什么大公司發(fā)明的,完全是一個(gè)個(gè)人業(yè)余興趣作品。為了使Monkey‘s Audio能有更好的發(fā)展,現(xiàn)在這個(gè)軟件已經(jīng)公開(kāi)了源代碼。
這種壓縮格式的特點(diǎn)是無(wú)損壓縮,也就是說(shuō)對(duì)壓縮數(shù)據(jù)進(jìn)行還原之后得到的數(shù)據(jù)與原來(lái)的數(shù)據(jù)是完全相同的。該格式的特點(diǎn)尤其適合那些擁有一對(duì)“金耳朵”并且一直對(duì)mp3的音質(zhì)耿耿于懷的音樂(lè)發(fā)燒友。后者有人會(huì)問(wèn),要無(wú)損壓縮,我隨便找個(gè)壓縮軟件比如WINRAR都可以達(dá)到不錯(cuò)的效果了,還要這種格式干嘛?所以這里要澄清一個(gè)誤解:使用普通的壓縮軟件進(jìn)行壓縮無(wú)疑是可以得到不錯(cuò)的壓縮效果,有時(shí)候甚至更優(yōu)于使用Monkey‘s Audio,但是壓縮軟件生成的壓縮包必須要先解壓還原之后才能播放里面的內(nèi)容,而Monkey‘s Audio這種無(wú)損壓縮編碼得到的文件可以直接使用播放器(比如WinAMP)進(jìn)行播放。Monkey‘s Audio的壓縮效果大約在2:1左右,也就是說(shuō)壓縮結(jié)果是原來(lái)的二分之一大小。一張CD大約需要330MB左右的空間存放,相比之下還是比較占空間的。由于這個(gè)原因,所以對(duì)音質(zhì)要求不是太高的人通常都選擇VBR方式的mp3而不是選擇它。
與Monkey‘s Audio類似的編碼格式還包括WavPack、RKAU、Shorten等等。由于相對(duì)不是那么出名,又或者在某些方面不夠Monkey‘s Audio做得好,因此獲得的關(guān)注程度就遜色很多。
圖表 - Monkey‘s Audio的壓縮/解壓器界面。那個(gè)猴子圖案挺有趣的。
蘋果專用 - aiff
剛才我們?cè)诮榻BWAV格式的時(shí)候已經(jīng)提到過(guò)AIFF了。它是Apple蘋果電腦(
http://www.apple.com)上面的標(biāo)準(zhǔn)音頻格式,屬于QuickTime技術(shù)(
http://www.apple.com/quicktime)的一部分。這一格式的特點(diǎn)就是格式本身與數(shù)據(jù)的意義無(wú)關(guān),因此受到了Microsoft的青睞,并據(jù)此搞出來(lái)WAV格式。AIFF雖然是一種很優(yōu)秀的文件格式,但由于它是蘋果電腦上的格式,因此在PC平臺(tái)上并沒(méi)有得到很大的流行。不過(guò)由于Apple電腦多用于多媒體制作出版行業(yè),因此幾乎所有的音頻編輯軟件和播放軟件都或多或少地支持AIFF格式。只要蘋果電腦還在,AIFF就始終還占有一席之地。
由于AIFF的包容特性,所以它支持許多壓縮技術(shù)。這里順帶說(shuō)說(shuō)的是在蘋果平臺(tái)上原生的流媒體壓縮技術(shù)是 QDesign公司(
http://www.qdesign.com)的QDMC,QDesign Music Codec。據(jù)官方資料介紹,QDesign Music Codec 2能在全帶寬立體聲的設(shè)置下將音頻壓縮為原來(lái)的百分之一大小。與其他純粹基于知覺(jué)音頻編碼技術(shù)(mp3等)不同的是,QDesign Music Codec 2 使用了新的專利的算法技術(shù),因此,可以在modem的速度上達(dá)到相當(dāng)?shù)囊纛l質(zhì)量。該技術(shù)最大支持128kbps。不過(guò)在筆者的實(shí)驗(yàn)結(jié)果看來(lái),該技術(shù)的唯一過(guò)人之處就是在任何比特率下都能提供44khz立體聲的輸出。不過(guò)脫離了音質(zhì)的輸出又有什么意思呢?
圖表 - Quick Time 6 的播放器,正在播放aiff格式的文件。
聊勝于無(wú) – au
au 是unix下一種常用的音頻格式,起源于Sun 公司(
http://www.sun.com)的 Solaris系統(tǒng)。這種格式本身也支持多種壓縮方式,但文件結(jié)構(gòu)的靈活性就比不上aiff和WAV。這種格式的最大問(wèn)題是由于它本身所依附的平臺(tái)不是面向廣大消費(fèi)者的,所以知道這東西的人并不多。但這種格式畢竟出現(xiàn)了很多年,所以許多播放器和音頻編輯軟件都提供了讀/寫支持。不過(guò)時(shí)至今日,在本人看來(lái)實(shí)在意義不大,因?yàn)檫@個(gè)文件格式對(duì)目前許多新出現(xiàn)的音頻技術(shù)都無(wú)法提供支持,起不到類似于WAV和aiff那種通用性音頻存儲(chǔ)平臺(tái)的作用。目前可能唯一必須使用au格式來(lái)保存音頻文件的就是java平臺(tái)。
曾經(jīng)輝煌 – VOC
當(dāng)年創(chuàng)新公司(Creative,
http://www.creative.com)的聲音卡成了PC平臺(tái)上的多媒體聲音卡事實(shí)標(biāo)準(zhǔn)的時(shí)候,VOC格式也跟同著成為了DOS系統(tǒng)下面的音頻文件格式標(biāo)準(zhǔn)。因?yàn)樗莿?chuàng)新公司發(fā)明的音頻文件格式。當(dāng)然,現(xiàn)在已經(jīng)很少見(jiàn)到了。由于該格式屬于硬件公司的產(chǎn)品,因此不可避免地帶有濃厚的硬件相關(guān)色彩。這一點(diǎn)隨著Windows平臺(tái)本身提供了標(biāo)準(zhǔn)的文件格式WAV之后就變成了明顯的缺點(diǎn)。加上Windows平臺(tái)不提供對(duì)VOC格式的直接支持,所以VOC格式很快便消失在人們的視線中。不過(guò)現(xiàn)在的很多播放器和音頻編輯器都還是支持該格式的,道理就跟au一樣:出來(lái)的早嘛!
記住你的聲音 - vox
這個(gè)格式比較特殊。Vox引申是voice的意思,表明了該格式專門面向語(yǔ)音音頻。它是由Dialogic公司(現(xiàn)已被Intel公司收購(gòu))發(fā)明的,使用ADPCM壓縮技術(shù)進(jìn)行壓縮,主要應(yīng)用于語(yǔ)音通信方面。由于面向語(yǔ)音壓縮,因此該技術(shù)專門針對(duì)低采樣律進(jìn)行優(yōu)化。該格式僅支持單聲道16位音頻,并達(dá)到了4:1的壓縮比(它將每個(gè)音頻有損壓縮為4個(gè)比特)。該格式最大的失敗在于沒(méi)有文件頭,無(wú)法在音頻文件中儲(chǔ)存相關(guān)的信息。如果你忘記了當(dāng)初是以什么采樣頻率錄的音,那就是一場(chǎng)惡夢(mèng)。這個(gè)文件格式最常見(jiàn)于一些利用互聯(lián)網(wǎng)進(jìn)行語(yǔ)音通信的軟件,比如PC2Phone。主流音頻編輯器一般都支持這個(gè)格式。
在介紹了這么多音頻媒體格式之后,我們來(lái)看看下面的特點(diǎn)概括列表:
媒體格式
擴(kuò)展名
相關(guān)公司或組織
主要優(yōu)點(diǎn)
主要缺點(diǎn)
適用領(lǐng)域
WAV
wav
Microsoft
可通過(guò)增加驅(qū)動(dòng)程序而支持各種各樣的編碼技術(shù)。
不適于傳播和用作聆聽(tīng)。支持的編碼技術(shù)大部分只能在Windows平臺(tái)下使用。
音頻原始素材保存。
mp3(MPEG 音頻)
mp3
(包括mp2
mp1
mpa等)
Fraunhofer-IIS
在低至128kbps的比特率下提供接近CD音質(zhì)的音頻質(zhì)量。廣泛的支持。
出現(xiàn)得比較早,因此音質(zhì)不是很好。
一般聆聽(tīng)和高保真聆聽(tīng)。
mp3PRO
mp3
Fraunhofer-IIS
CodingTechnologies
Thomson Multimedia
在低至64kbps的比特率下提供接近CD音質(zhì)的音頻質(zhì)量。
專利費(fèi)用較高,支持的軟件和硬件不多。
一般聆聽(tīng)和高保真聆聽(tīng)。
RealMedia
ra, rma
RealNetworks
在極低的比特率環(huán)境下提供可聽(tīng)的音頻質(zhì)量。
不適于除網(wǎng)絡(luò)傳播之外的用途。音質(zhì)不是很好。
網(wǎng)絡(luò)音頻流傳輸。
Windows Media
wma, asf
Microsoft
功能齊全,使用方便。同時(shí)支持無(wú)失真、有失真、語(yǔ)音壓縮方式。
失真壓縮方式下音質(zhì)不高。必須在Windows平臺(tái)下才能使用。
音頻檔案級(jí)別保存,一般聆聽(tīng),網(wǎng)絡(luò)音頻流傳輸。
MIDI
MID
MIDI
RMI
XMI
等
MIDI Association
音頻數(shù)據(jù)為樂(lè)器的演奏控制,通常不帶有音頻采樣。
沒(méi)有波表硬件或軟件配合時(shí)播放效果不佳。
與電子樂(lè)器的數(shù)據(jù)交互,樂(lè)曲創(chuàng)作等。
Ogg Vorbis
OGG
Xiph Foundation
在低至64kbps的比特率下提供接近CD音質(zhì)的音頻質(zhì)量。開(kāi)放源代碼,不需要支付使用許可費(fèi)用。跨平臺(tái)。
發(fā)展較慢。推廣力度不足。
一般聆聽(tīng)和高保真聆聽(tīng)。
VQF
vqf
tvq
NTT Human Interface Laboratories
在低至96kbps的比特率下提供接近CD音質(zhì)的音頻質(zhì)量。
相關(guān)軟件太少。
一般聆聽(tīng)。
MOD(Module)
mod s3m it xm mtm ult 669 等
Amiga和mod社區(qū)
音頻數(shù)據(jù)由樂(lè)器采樣和樂(lè)譜、演奏控制信息組成。
具體的文件格式太多影響推廣和使用。
一般聆聽(tīng)。
Monkey‘s Audio
ape
Matthew T. Ashland
無(wú)失真壓縮。部分開(kāi)放代碼。
由于是個(gè)人作品,使用上存在一定風(fēng)險(xiǎn)。
高保真聆聽(tīng)和音頻檔案級(jí)別保存。
aiff
aiff
Apple
可通過(guò)增加驅(qū)動(dòng)程序而支持各種各樣的編碼技術(shù)
一般限于蘋果電腦平臺(tái)使用。
蘋果電腦平臺(tái)下音頻原始素材保存。
au
au
Sun
Unix和Java平臺(tái)下的標(biāo)準(zhǔn)文件格式。
支持的壓縮技術(shù)太少且音頻數(shù)據(jù)格式受文件格式本身局限。
Unix和Java平臺(tái)下音頻原始素材保存。
voc
voc
Creative
對(duì)于目前的音頻技術(shù)來(lái)講,該格式已經(jīng)沒(méi)有什么優(yōu)點(diǎn)了。
與具體的硬件相結(jié)合因此沒(méi)有延續(xù)性。
淘汰。
vox
vox
Dialogic
面向語(yǔ)音的編碼。
文件格式缺乏足夠的信息,因此不適應(yīng)作存檔用途。技術(shù)比較早期。
淘汰。
當(dāng)然,無(wú)論一種音頻格式目前是否主流,在未來(lái)都有可能被新出現(xiàn)的更先進(jìn)的技術(shù)取代。不過(guò)從目前的形勢(shì)來(lái)看,音頻技術(shù)已經(jīng)發(fā)展到了一個(gè)成熟的、優(yōu)勝劣汰的階段。那些沒(méi)有技術(shù)優(yōu)勢(shì)的音頻格式將很快就會(huì)被市場(chǎng)淘汰掉,而存活下來(lái)的音頻技術(shù)由于技術(shù)性能方面已經(jīng)非常接近且基本上不存在繼續(xù)發(fā)展的空間,將會(huì)努力從網(wǎng)絡(luò)功能和應(yīng)用功能兩方面去吸引用戶并打倒競(jìng)爭(zhēng)對(duì)手。因此,實(shí)力強(qiáng)大的商業(yè)公司在這方面有著充分的優(yōu)勢(shì)??上驳氖怯捎陂_(kāi)放源代碼運(yùn)動(dòng)的發(fā)展,我們?cè)谏虡I(yè)技術(shù)之外還可以有另外一個(gè)選擇。所以,音頻技術(shù)的發(fā)展可以肯定的是只會(huì)剩下一個(gè)商業(yè)公司的技術(shù)和一個(gè)開(kāi)放源碼的技術(shù)并存。就像現(xiàn)在的操作系統(tǒng)之爭(zhēng)那樣。
作為一個(gè)音頻技術(shù)的用戶,如何選擇適合自己的音頻格式是一個(gè)比較頭疼的事情。有些人趨向音質(zhì)要求高;有些則需要豐富的附加功能。要做出自己的選擇,則必須首先搞清楚自己需要的是什么。另外,需要提醒大家的是,隨著中國(guó)電子政務(wù)的鋪開(kāi)以及Linux在電子政務(wù)中的應(yīng)用,我們必須重視開(kāi)放源代碼這一不可忽視的要素,否則由于選擇錯(cuò)了音頻格式而導(dǎo)致隨后工作的推倒重來(lái)那可是嚴(yán)重的經(jīng)濟(jì)損失。
希望大家看完這篇文章后能對(duì)目前繁多的各種音頻格式有一個(gè)大致的了解,并能正確地作出適合自己的選擇。