現(xiàn)在絕大多數(shù)人都會(huì)遇到歌曲或電影太大或者是格式不支持,而需要進(jìn)行格式轉(zhuǎn)換,有的也叫音頻轉(zhuǎn)換或視頻轉(zhuǎn)換;現(xiàn)在,絕大多數(shù)轉(zhuǎn)換器都會(huì)使用術(shù)語。對(duì)不了解這些的用戶而言,往往會(huì)造成極大困擾,在這里,我就將針對(duì)音視頻轉(zhuǎn)換中現(xiàn)在常用到的基礎(chǔ)術(shù)語,及其變動(dòng)對(duì)音視頻文件所產(chǎn)生的影響,盡量用淺顯簡明的語言做一下集中解釋。
一般來說,視頻轉(zhuǎn)換的常用術(shù)語包括直接影響畫質(zhì)、音質(zhì)的幀大小和速率、比特率等(主帖),影響壓縮率及畫質(zhì)的編碼器等(一樓),主要影響播放體驗(yàn)的格式等(二樓),還有就是影響轉(zhuǎn)碼速度某些設(shè)置(三樓)。為了照顧大多數(shù)童鞋,再加上個(gè)人水平有限,有些專業(yè)性特別強(qiáng)的內(nèi)容不夠準(zhǔn)確,但大意應(yīng)該是對(duì)的。
一、與畫質(zhì)、音質(zhì)等有關(guān)的術(shù)語
這些術(shù)語術(shù)語包括幀大小、幀速率、比特率及采樣率等。
1、幀
一般來說,幀是影像常用的最小單位,簡單的說就是組成一段視頻的一幅幅圖片。電影的播放連續(xù)的幀播放所產(chǎn)生的,現(xiàn)在大多數(shù)視頻也類似,下面說說幀速率和幀大小。
幀速率,有的轉(zhuǎn)換器也叫幀率,或者是每秒幀數(shù)一類的,這可以理解為每一秒的播放中有多少張圖片,一般來說,我們的眼睛在看到東西時(shí),那些東西的影像會(huì)在眼睛中停留大約十六分之一秒,也就是視頻中只要每秒超過15幀,人眼就會(huì)認(rèn)為畫面是連續(xù)不斷的,事實(shí)上早期的手繪動(dòng)畫就是每秒播放15張以上的圖片做出來的。但這只是一般情況,當(dāng)視頻中有較快的動(dòng)作時(shí),幀速率過小,動(dòng)作的畫面跳躍感就會(huì)很嚴(yán)重,有明顯的失真感。因此幀速率最好在24幀及以上,這24幀是電影的幀速率。
幀大小,有的轉(zhuǎn)換器也叫畫面大小或屏幕大小等,是組成視頻的每一幀的大小,直觀表現(xiàn)為轉(zhuǎn)換出來的視頻的分辨率的大小。一般來說,軟件都會(huì)預(yù)置幾個(gè)分辨率,一般為320×240、480×320、640×360、800×480、960×540、1280×720及1920×1080等,當(dāng)然很多轉(zhuǎn)換器提供自定義選項(xiàng),這里,不得改變視頻長寬比例。一般根據(jù)所需要想要在什么設(shè)備上播放來選擇分辨率,如果是轉(zhuǎn)換到普通手機(jī)、PSP等設(shè)備上,視頻分辨率選擇與設(shè)備分辨率相同,否則某些設(shè)備可能會(huì)播放不流暢,設(shè)備分辨率的大小一般都可以在中關(guān)村在線上查到。
2、比特率
比特率,又叫碼率或數(shù)據(jù)速率,是指每秒傳輸?shù)囊曨l數(shù)據(jù)量的大小,音視頻中的比特率,是指由模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的采樣率;采樣率越高,還原后的音質(zhì)和畫質(zhì)就越好;音視頻文件的體積就越大,對(duì)系統(tǒng)配置的要求也越高。
在音頻中,1M以上比特率的音樂一般只能在正版CD中找到,500K到1M的是以APE、FLAC等為擴(kuò)展名的無損壓縮的音頻格式,一般的MP3是在96K到320K之間。目前,對(duì)大多數(shù)人而言,對(duì)一般人而言192K就足夠了。
在視頻中,藍(lán)光高清的比特率一般在40M以上,DVD一般在5M以上,VCD一般是在1M以上。(這些均是指正版原盤,即未經(jīng)視頻壓縮的版本)。常見的視頻文件中,1080P的碼率一般在2到5M之間,720P的一般在1到3M,其他分辨率的多在一M一下。
視頻文件的比特率與幀大小、幀速率直接相關(guān),一般幀越大、速率越高,比特率也就越大。當(dāng)然某些轉(zhuǎn)換器也可以強(qiáng)制調(diào)低比特率,但這樣一般都會(huì)導(dǎo)致畫面失真,如產(chǎn)生色塊、色位不正、出現(xiàn)鋸齒等情況。
3、采樣率
這個(gè)基本在視頻轉(zhuǎn)換中出現(xiàn),少數(shù)音頻或視頻中的轉(zhuǎn)換時(shí)會(huì)出現(xiàn)。
聲音是一種波,有頻率和振幅的特征,頻率對(duì)應(yīng)于時(shí)間軸線,振幅對(duì)應(yīng)于電平軸線。波是無限光滑的,弦線可以看成由無數(shù)點(diǎn)組成,在數(shù)字編碼過程中,需要抽取某點(diǎn)的頻率值,很顯然,在一秒中內(nèi)抽取的點(diǎn)越多,獲取得頻率信息更豐富,所能描述的聲波頻率就越高。
一般來說,廣播使用22050Hz,CD使用44100,DVD使用48000。
4、綜述
二、視頻轉(zhuǎn)換常用到的編碼器
未經(jīng)壓縮的視頻基本上是無法進(jìn)行傳播的,特別的是放到網(wǎng)上更是幾乎不可能。舉個(gè)例子,我大二下學(xué)期學(xué)的視頻編輯,當(dāng)時(shí)不知道,直接從母帶導(dǎo)出進(jìn)行編輯,一個(gè)多小時(shí)有十來個(gè)G。視頻壓縮現(xiàn)在一般是解碼后通過編碼器對(duì)視頻進(jìn)行重編碼,以壓縮視頻體積。常用的和常見到的視頻編碼器有H.264、Xvid、mpeg4、WMVideo、Real Media等。音頻編碼器由于常常與格式同名,故放在二樓說明。
1、壓縮方式
壓縮一般分軟件壓縮和硬件壓縮,這里只說軟件壓縮。
軟件壓縮不是說用什么壓縮軟件,而是用什么編碼器。壓縮的方式主要分兩種:
一是對(duì)幀和音頻進(jìn)行壓縮,對(duì)幀的壓縮主要是提取視頻中的關(guān)鍵幀,并通過某些圖像算法對(duì)幀進(jìn)行壓縮;音頻壓縮是指是指降低信號(hào)動(dòng)態(tài)以濾除噪聲和避免動(dòng)態(tài)過大的失真。
二是針對(duì)各種冗余,表現(xiàn)為除了對(duì)段時(shí)間內(nèi)的除了對(duì)單幅圖像進(jìn)行編碼,還有幀重構(gòu),以及利用基于塊的運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償、幀內(nèi)編碼和熵編碼等技術(shù),還有去除人感覺不到的圖像細(xì)節(jié)和頻段,或通過制造聽覺和視覺上的錯(cuò)覺,從而大幅度降低音視頻文件的大小。
2、H.264
H.264標(biāo)準(zhǔn)的主要目標(biāo)是:與其它現(xiàn)有的視頻編碼標(biāo)準(zhǔn)相比,在相同的帶寬下提供更加優(yōu)秀的圖象質(zhì)量。為此,H.264與充分利用了包括統(tǒng)計(jì)冗余和視覺生理冗余在內(nèi)的各種冗余。
這種壓縮方式能夠在低碼率的情況下提供高質(zhì)量的圖像,并且具有較強(qiáng)的容錯(cuò)能力和網(wǎng)絡(luò)適應(yīng)性。這個(gè)簡單的說就是,H.264編碼的視頻文件,在相同畫質(zhì)下會(huì)比其他編碼方式得到的視頻文件更小,同時(shí)不容易出現(xiàn)花屏或不能播放。但缺點(diǎn)是,H.264的視頻相對(duì)于其他編碼的視頻,同樣畫質(zhì)的文件,對(duì)硬件配置的要求更高。但對(duì)現(xiàn)在的硬件而言,基本都只是在將視頻轉(zhuǎn)換為H.264的視頻是會(huì)更慢一點(diǎn),播放一般都沒問題。
3、MPEG-4
MPEG-4最開始只是一個(gè)視頻編解碼標(biāo)準(zhǔn),但現(xiàn)在不只是視頻編解碼標(biāo)準(zhǔn),參與者及分支眾多,但這里只討論運(yùn)動(dòng)圖像專家組MPEG的mpeg-4視頻編解碼方面,其他不管。這個(gè)視頻編解碼器利用很窄的帶寬,通過幀重建、運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償?shù)燃夹g(shù),壓縮數(shù)據(jù),以求以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。
在相同碼率下,這種編碼方式的視頻將比其他編碼方式的視頻有更高的畫質(zhì)、音質(zhì),同時(shí)具有較好的容錯(cuò)性和網(wǎng)絡(luò)適應(yīng)能力,轉(zhuǎn)換出來的視頻對(duì)硬件的要求也較低。但是由于當(dāng)前某些技術(shù)的限制,在壓縮比較高時(shí),會(huì)出現(xiàn)色塊。
另外,mpeg-4并不是一個(gè)死的標(biāo)準(zhǔn),它每年都有一定的改進(jìn)。(不會(huì)影響到舊視頻的播放)
4、Xvid
Xvid(舊稱為XviD)是MPEG-4一類的視頻編解碼器,Xvid支持多種編碼模式,支持量化和范圍控制,運(yùn)動(dòng)偵測(cè)、動(dòng)態(tài)關(guān)鍵幀距和曲線平衡分配等眾多編碼技術(shù)。
Xvid作為世界上第一個(gè)第一個(gè)真正開放源代碼的,通過GPL協(xié)議發(fā)布的視頻編解碼器。近五年來,XviD一直是世界上最流行的視頻編碼器。估計(jì)在BT(BitTorrent)和eMule上至少90%的電影、電視劇是用XviD壓制的。
使用的技術(shù)不同,視頻的質(zhì)量和大小都不同,一般視頻轉(zhuǎn)換器的所使用的xvid編碼器,轉(zhuǎn)換出來的視頻就畫質(zhì)與大小而言,與轉(zhuǎn)化器中的mpeg-4并無多少差別。
5、WMVideo
WMVideo是軟件巨人微軟的產(chǎn)品,其最新的幾個(gè)版本的壓縮率已經(jīng)同H.264相當(dāng)。現(xiàn)在微軟的WMA-HD和H.264已成為下一代DVD,即HD-DVD技術(shù)的強(qiáng)制執(zhí)行標(biāo)準(zhǔn)。
值得注意得是,少數(shù)系統(tǒng)或平臺(tái)不支持這個(gè),同時(shí),容錯(cuò)性與前面幾個(gè)相對(duì)要低一點(diǎn),而且在網(wǎng)絡(luò)上的加載速度要比其他標(biāo)準(zhǔn)都低一點(diǎn)。
6、Real Media
Real Media是Real公司開發(fā)的一種一種高壓縮比的視頻格式,其最初的想法是用來在低速率的網(wǎng)絡(luò)實(shí)時(shí)傳輸活動(dòng)視頻影像和在極低的網(wǎng)絡(luò)帶寬下提供不間斷的畫質(zhì)較高的音視頻。
Real Media壓縮標(biāo)準(zhǔn)在相當(dāng)長一段時(shí)間內(nèi),其壓縮率都居于全球之冠,一度在全球非常有名,在國內(nèi)也長期占據(jù)是使用率最高的音視頻編碼標(biāo)準(zhǔn)(目前貌似還是)。但是由于該標(biāo)準(zhǔn)本身存在色彩還原度不高(即轉(zhuǎn)換后的視頻色彩上有細(xì)微變動(dòng))、容易出現(xiàn)色塊、快速運(yùn)動(dòng)圖像容易模糊的問題,而且目前H.264、mpeg-4、Xvid、WMV-9及其以后版本等視頻編解碼器的壓縮率都不低于它,再加上這個(gè)標(biāo)準(zhǔn)的版權(quán)在Real(嚴(yán)重鄙視某幾個(gè)知名播放器的盜版行為),所以目前這個(gè)標(biāo)準(zhǔn)的使用率每況日下。
7、其他標(biāo)準(zhǔn)
除了上面這幾個(gè),當(dāng)然還有其他的編解碼器,如中國的AVS、蘋果公司的Sorenson和Cinepak、英特爾的Indeo Video、H.263等。但由于使用范圍過窄,應(yīng)用了這些標(biāo)準(zhǔn)的播放器不多,因此就不予介紹了。
三、音視頻轉(zhuǎn)換時(shí)常見到的格式
(一)音頻轉(zhuǎn)換
音頻轉(zhuǎn)換中常用的格式主要有APE、FLAC、midi、WAV、MP3、WMV、RA、OGG等,于視頻不同,音頻轉(zhuǎn)換的格式往往是與編碼方式相對(duì)應(yīng)的。
1、WAV
WAV是微軟公司開發(fā)的一種聲音文件格式,它符合 PIFFResource Interchange File Format 文件規(guī)范,用于保存WINDOWS平臺(tái)的音頻信息資源,被WINDOWS平臺(tái)及其應(yīng)用程序所支持。WAV格式支持MSADPCM、CCITT A LAW等多種壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道。標(biāo)準(zhǔn)格式的WAV文件音質(zhì)和CD相差無幾,也是目前PC機(jī)上廣為流行的聲音文件格式,幾乎所有的音頻編輯軟件都“認(rèn)識(shí)”WAV格式。播放這種文件,推薦使用Winamp、foobar2000等專業(yè)級(jí)的播放器,并配備好一些的音箱和耳機(jī)。
2、FLAC及APE
FLAC即是Free Lossless Audio Codec的縮寫,中文可解為無損音頻壓縮編碼。FLAC是一套著名的自由音頻壓縮編碼,其特點(diǎn)是無損壓縮,也就是說當(dāng)你將從音頻CD上讀取的音頻數(shù)據(jù)文件壓縮成FLAC格式后,你還可以再將FLAC格式的文件還原,而還原后的音頻文件與壓縮前的一模一樣。APE也是一直無損壓縮音頻技術(shù)。這兩者格式的文件大小大概為CD的一半,但是隨著寬帶的普及,它們受到了許多音樂愛好者的喜愛,特別是對(duì)于希望通過網(wǎng)絡(luò)傳輸音頻CD的朋友來說,二者可以幫助他們節(jié)約大量的資源。
現(xiàn)在二者已被很多軟件及硬件音頻產(chǎn)品所支持。播放這兩種文件,同樣推薦使用Winamp、foobar2000等專業(yè)級(jí)的播放器,并配備好一些的音箱和耳機(jī)。
這兩者中,APE的壓縮率更高一點(diǎn),但容錯(cuò)性稍低,解碼速度稍慢。
3、MP3
MP3格式誕生于八十年代的德國,所謂的MP3也就是指的是MPEG標(biāo)準(zhǔn)中的音頻部分,也就是MPEG音頻層。根據(jù)壓縮質(zhì)量和編碼處理的不同分為3層,分別對(duì)應(yīng)“*.mp1"/“*.mp2”/“*.mp3”這3種聲音文件。
MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時(shí)基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質(zhì)量來換取文件的尺寸,相同長度的音樂文件,用*.mp3格式來儲(chǔ)存,一般只有*.wav文件的1/10,而音質(zhì)要次于CD格式、WAV格式及無損的聲音文件。
由于其文件尺寸小,音質(zhì)好;所以在它問世之初還沒有什么別的音頻格式可以與之匹敵,因而為mp3格式的發(fā)展提供了良好的條件。直到現(xiàn)在,這種格式還是風(fēng)靡一時(shí),作為主流音頻格式的地位難以被撼動(dòng)。但是樹大招風(fēng),MP3音樂的版權(quán)問題也一直是找不到辦法解決,因?yàn)镸P3沒有版權(quán)保護(hù)技術(shù),說白了也就是誰都可以用。
MP3格式壓縮音樂的采樣頻率有很多種,可以用64Kbps或更低的采樣頻率節(jié)省空間,也可以用320Kbps的標(biāo)準(zhǔn)達(dá)到極高的音質(zhì)。
4、WMA
WMA (Windows Media Audio) 格式以減少數(shù)據(jù)流量但保持音質(zhì)的方法來達(dá)到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達(dá)到1:18左右。
WMA這種格式在錄制時(shí)可以對(duì)音質(zhì)進(jìn)行調(diào)節(jié)。同一格式,音質(zhì)好的可與CD媲美,壓縮率較高的可用于網(wǎng)絡(luò)廣播。此外WMA的支持內(nèi)容提供商通過DRM方案如Windows Media Rights Manager 7加入防拷貝保護(hù)。這種內(nèi)置了版權(quán)保護(hù)技術(shù)可以限制播放時(shí)間和播放次數(shù)甚至于播放的機(jī)器等等;另外WMA還支持音頻流技術(shù),適合在網(wǎng)絡(luò)上在線播放。
Windows操作系統(tǒng)和Windows Media Player無縫集成,直接使用Windows Media Player播放即可。
5、RealAudio
RealAudio主要適用于在網(wǎng)絡(luò)上的在線音樂欣賞,主要有這么幾種:有RA、RM、RMX,還有更多。這些格式的特點(diǎn)是可以隨網(wǎng)絡(luò)帶寬的不同而改變聲音的質(zhì)量,在保證大多數(shù)人聽到流暢聲音的前提下,令帶寬較富裕的聽眾獲得較好的音質(zhì)。
但由于隨著網(wǎng)絡(luò)帶寬的普遍改善,RealAudio又不能提供同等大小下的更好音質(zhì),目前已很少看見了。
6、OGG
OGG格式完全開源,完全免費(fèi), 和mp3不相上下的新格式。 與MP3類似,OGGVorbis也是對(duì)音頻進(jìn)行有損壓縮編碼,但通過使用更加先進(jìn)的聲學(xué)模型去減少損失,因此,相同碼率編碼的OGGVorbis比MP3音質(zhì)更好一些,文件也更小一些。
另外,MP3格式是受專利保護(hù)的。發(fā)布或者銷售MP3編碼器、MP3解碼器、MP3格式音樂作品,都需要付專利使用費(fèi)。而OGGVorbis就完全沒有這個(gè)問題。目前,OGGVorbis雖然還不普及,但在音樂軟件、游戲音效、便攜播放器、網(wǎng)絡(luò)瀏覽器上都得到廣泛支持。
7、MIDI
MIDI允許數(shù)字合成器和其他設(shè)備交換數(shù)據(jù)。MID文件格式由MIDI繼承而來。MID文件并不是一段錄制好的聲音,而是記錄聲音的信息,然后在告訴聲卡如何再現(xiàn)音樂的一組指令。這樣一個(gè)MIDI文件每存1分鐘的音樂只用大約5~10KB。
當(dāng)前,MID文件主要用于原始樂器作品,流行歌曲的業(yè)余表演,游戲音軌以及電子賀卡等。mid文件重放的效果完全依賴聲卡的檔次。mid格式的最大用處是在電腦作曲領(lǐng)域。mid文件可以用作曲軟件寫出,也可以通過聲卡的MIDI口把外接音序器演奏的樂曲輸入電腦里,制成mid文件。
8、AAC
AAC(Advanced Audio Coding)是一種專為聲音數(shù)據(jù)設(shè)計(jì)的文件壓縮格式。利用AAC格式,可使人感覺聲音質(zhì)量沒有明顯降低AAC標(biāo)志的前提下,更加小巧。相對(duì)于MP3,AAC可提供最多48個(gè)全音域聲道,最高支持96KHz的采樣頻率,解碼播放所占的資源更少。
在杜比實(shí)驗(yàn)室的測(cè)試中,128Kbps的AAC立體聲音樂被專家認(rèn)為不易察覺到與原來未壓縮音源的區(qū)別;AAC格式在96Kbps碼率的表現(xiàn)超過了128Kbps的MP3格式;同樣是128Kbps,AAC格式的音質(zhì)明顯好于MP3;AAC是目前唯一一個(gè),能夠在所有的EBU試聽測(cè)試項(xiàng)目的獲得“優(yōu)秀”的網(wǎng)絡(luò)廣播格式。
目前該編碼格式廣泛運(yùn)用于電影、電視劇、動(dòng)漫新番的封裝中。
9、AC-3
AC-3全稱“杜比AC-3”(Dolby Surround Audio Coding-3),是杜比公司開發(fā)的新一代家庭影院多聲道數(shù)字音頻編碼方式。杜比數(shù)字AC-3是根據(jù)感覺來開發(fā)的編碼系統(tǒng)多聲道環(huán)繞聲。它將每一種聲音的頻率根據(jù)人耳的聽覺特性區(qū)分為許多窄小頻段,在編碼過程中再根據(jù)音響心理學(xué)的原理進(jìn)行分析,保留有效的音頻,刪除多作的信號(hào)和各種噪聲頻率,使重現(xiàn)的聲音更加純凈,分離度極高。
杜比數(shù)字AC-3系統(tǒng)可用前置的左、右音箱,中置音箱產(chǎn)生極有深度感和定位明確的音場(chǎng),用兩個(gè)后置或側(cè)置的環(huán)繞音箱和超低音箱表現(xiàn)寬廣壯闊的音場(chǎng),而六個(gè)聲道的信息在制作和還原過程中全部數(shù)字化,信息損失的很少。
目前它已被美國采用作為高清晰電視(HDTV)音頻系統(tǒng),最新DVD機(jī)也包含杜比數(shù)字AC-3。相當(dāng)多的MKV高清視頻封裝時(shí)也會(huì)采用AC-3格式。
(二)、視頻轉(zhuǎn)換中的常見格式
常用到的格式主要有AVI、MP4、MKV、WMV、RMVB、FLV、MOV等。
1、AVI
AVI即音頻視頻交錯(cuò)格式。是將語音和影像同步組合在一起的文件格式。采用一種有損壓縮方式,壓縮比較高,畫面質(zhì)量不是太好,但由于絕大多數(shù)視頻編輯及轉(zhuǎn)換軟件導(dǎo)入導(dǎo)出avi格式較快,有些可以直接編輯AVI格式。因此這個(gè)格式在某些領(lǐng)域運(yùn)用的非常廣泛。
另外,AVI格式也是一般的設(shè)備和系統(tǒng)都能支持的基礎(chǔ)格式。
2、MP4和RMVB
MP4大多使用mpeg-4或H.264視頻編碼器壓縮。RMVB使用Real Media視頻編碼器壓縮。這幾種的優(yōu)劣樓上已說明,就不再說了。
這兩個(gè)在現(xiàn)在一般是電影、電視劇、動(dòng)漫在剛出來時(shí),發(fā)布資源時(shí)用的。其中RMVB格式用的越來越少了。
MP4格式一般的手機(jī)或其他設(shè)備、播放器、系統(tǒng)都可以直接播放(不一定流暢)。
3、MKV
MKV嚴(yán)格的來說并不是一個(gè)視頻格式,它是多媒體封裝格式,最大的特點(diǎn)就是能容納多種不同類型編碼的視頻、音頻及字幕流,它可將多種不同編碼的視頻及16條以上不同格式的音頻和不同語言的字幕流封裝到一MKV文件當(dāng)中。
大多數(shù)字幕組發(fā)布DVD片源及BD片源的日漫、歐美大片時(shí),特別是發(fā)布該資源的最終版本時(shí),基本上都會(huì)使用這個(gè)格式。
目前絕大多數(shù)播放器都能支持該格式。
4、FLV
FLV 是FLASH VIDEO的簡。由于形成的文件極小、加載速度極快,在網(wǎng)絡(luò)視頻中,運(yùn)用極為廣泛,是目前增長最快、最為廣泛的視頻傳播格式,但基本僅用于網(wǎng)絡(luò)視頻。
同樣,絕大多數(shù)播放器都支持該格式。
5、MOV
QuickTime具有跨平臺(tái)、存儲(chǔ)空間要求小等技術(shù)特點(diǎn),采用了有損壓縮方式的MOV格式文件,畫面效果較AVI格式要稍微好一些。
目前基本僅見于IOS、Mac和專門面向二者的網(wǎng)站上,但大多數(shù)播放器仍然支持該格式。
6、其它格式
以上這些就是具有代表性的幾種格式。除了這些還有RM、ASF、3GP等。
四、影響轉(zhuǎn)碼速度某些設(shè)置及其他相關(guān)
相當(dāng)多的播放器為獲得更好的轉(zhuǎn)換效率,都有寫加快轉(zhuǎn)換效率的設(shè)置,主要有硬件加速、流直通等。同時(shí)還會(huì)有一些提升播放體驗(yàn)的設(shè)置,但其中的某些功能會(huì)導(dǎo)致視頻轉(zhuǎn)換速度大大降低,如將字幕硬性混入視頻,二次編碼等。
1、硬件加速
硬件加速是指在計(jì)算機(jī)中通過把計(jì)算量非常大的工作分配給專門的硬件來處理來減輕中央處理器的工作量的技術(shù)。
使用硬件加速,可以將CPU從視頻流的轉(zhuǎn)換中部分解放出來,從而加快視頻轉(zhuǎn)換的速度和降低轉(zhuǎn)碼時(shí)的資源占用。但是開啟硬件加速在極少數(shù)情況下,可能會(huì)導(dǎo)致畫質(zhì)降低。另外,大多數(shù)視頻轉(zhuǎn)換軟件都只支持nVIDIA顯卡。
2、流直通
一個(gè)視頻文件,一般是由一個(gè)視頻流,可能有的多個(gè)音頻流,以及可能被封裝到視頻中的字幕流,在這里面,視頻流占了視頻文件體積的大部分;但轉(zhuǎn)換視頻時(shí),有相當(dāng)長的時(shí)間和CPU資源會(huì)消耗在音頻轉(zhuǎn)換上面。
很多時(shí)候,轉(zhuǎn)換視頻格式,都只是因?yàn)榉直媛?、文件大小或者是文件格式的問題,并不一定需要轉(zhuǎn)換音頻流,所以大多數(shù)稍微專業(yè)一點(diǎn)的播放器,都有流直通復(fù)制的選項(xiàng)。選中該選項(xiàng)后,音頻流將被直接復(fù)制新的視頻文件中,從而將部分CPU資源解放出來,降低轉(zhuǎn)換時(shí)的CPU占用和轉(zhuǎn)換時(shí)間。
另外,進(jìn)行視頻合并及視頻分割時(shí),如果視頻流的編碼器、碼率、分辨率等,音頻流的碼率、編碼器、采樣率等,字幕流格式一致,那么某些音視頻轉(zhuǎn)換工具可以直接合并流,而不進(jìn)行重新編碼。這回極大地加快合并或分割速度,一般只需要不到十秒。但我只知道QQ影音自帶的轉(zhuǎn)換器可以。
3、字幕硬性混入視頻
當(dāng)視頻與字幕放到同一個(gè)文件夾下時(shí),有些轉(zhuǎn)換軟件可以將字幕硬性混入視頻(一般要文件名相同)。這個(gè)字幕硬性混入視頻是指將字幕文件或字幕流混入到視頻流中,也就是將字幕疊加到相應(yīng)的幀上去,其好處在于,字幕在視頻上,只要視頻能播放,字幕就能顯示。這么做,將會(huì)加大視頻轉(zhuǎn)換所需的時(shí)長和轉(zhuǎn)換時(shí)的CPU占用。
4、二次編碼
在視頻轉(zhuǎn)換時(shí)我們會(huì)用到一次編碼(CBR)或二次編碼(VBR)。
一次編碼CBR(固定碼率):保持碼率基本維持在平均碼率。實(shí)現(xiàn)簡單,對(duì)復(fù)雜場(chǎng)景會(huì)因碼率不足造成馬賽克現(xiàn)象,對(duì)于簡單場(chǎng)景則不能充分利用編碼空間。(這里講的復(fù)雜場(chǎng)景是指細(xì)節(jié)/邊緣豐富以及快速變化場(chǎng)景)。
二次編碼VBR, (2-pass VBR), 在第一次其實(shí)是檢測(cè)收集運(yùn)動(dòng)啊亮度等相關(guān)數(shù)據(jù),這樣在第二次編碼的時(shí)候就會(huì)針對(duì)不同的場(chǎng)景來進(jìn)行動(dòng)態(tài)的壓縮編碼。二次編碼比一次編碼質(zhì)量要好一些的。但是編碼時(shí)間也會(huì)增加不少。使用二次編碼可以把變化不大的畫面轉(zhuǎn)換時(shí)碼率低一些(如靜態(tài)畫面),而變化大的碼率高一些(如打斗動(dòng)作部分),這樣碼率是變化的,可以使整部影片的清晰度比較均勻。
二次編碼將會(huì)使轉(zhuǎn)碼所需要的時(shí)間加大一半還多。
聯(lián)系客服