第一篇 多媒體基本概念
1.多媒體的定義
“多媒體”一詞譯自英文“Multimedia”,而該詞又是由mutiple和media復(fù)合而成的。媒體(medium)原有兩重含義,一是指存儲信息的實體,如磁盤、光盤、磁帶、半導(dǎo)體存儲器等,中文常譯作媒質(zhì);二是指傳遞信息的載體,如數(shù)字、文字、聲音、圖形等,中文譯作媒介。所以與多媒體對應(yīng)的一詞是單媒體(Monomedia),從字面上看,多媒體就是由單媒體復(fù)合而成的啦。
多媒體技術(shù)從不同的角度有著不同的定義。比如有人定義“多媒體計算機是一組硬件和軟件設(shè)備;結(jié)合了各種視覺和聽覺媒體,能夠產(chǎn)生令人印象深刻的視聽效果。在視覺媒體上,包括圖形、動畫、圖像和文字等媒體,在聽覺媒體上,則包括語言、立體聲響和音樂等媒體。用戶可以從多媒體計算機同時接觸到各種各樣的媒體來源”。還有人定義多媒體是“傳統(tǒng)的計算媒體----文字、圖形、圖像以及邏輯分析方法等與視頻、音頻以及為了知識創(chuàng)建和表達的交互式應(yīng)用的結(jié)合體”。概括起來就是:多媒體技術(shù),即是計算機交互式綜合處理多媒體信息----文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個系統(tǒng)并具有交互性。簡言之,多媒體技術(shù)就是具有集成性、實時性和交互性的計算機綜合處理聲文圖信息的技術(shù)(這句話的三性可是精髓哦?。?。多媒體在我國也有自己的定義,一般認為多媒體技術(shù)指的就是能對多種載體(媒介)上的信息和多種存儲體(媒介)上的信息進行處理的技術(shù)。
2.多媒體的關(guān)鍵技術(shù)
由于多媒體系統(tǒng)需要將不同的媒體數(shù)據(jù)表示成統(tǒng)一的結(jié)構(gòu)碼流,然后對其進行變換、重組和分析處理,以進行進一步的存儲、傳送、輸出和交互控制。所以,多媒體的傳統(tǒng)關(guān)鍵技術(shù)主要集中在以下四類中:數(shù)據(jù)壓縮技術(shù)、大規(guī)模集成電路(VLSI)制造技術(shù)、大容量的光盤存儲器(CD-ROM)、實時多任務(wù)操作系統(tǒng)。因為這些技術(shù)取得了突破性的進展,多媒體技術(shù)才得以迅速的發(fā)展,而成為像今天這樣具有強大的處理聲音、文字、圖像等媒體信息的能力的高科技技術(shù)。
但說到當(dāng)前要用于互聯(lián)網(wǎng)絡(luò)的多媒體關(guān)鍵技術(shù),有些專家卻認為可以按層次分為媒體處 理與編碼技術(shù)、多媒體系統(tǒng)技術(shù)、多媒體信息組織與管理技術(shù)、多媒體通信網(wǎng)絡(luò)技術(shù)、多媒 體人機接口與虛擬現(xiàn)實技術(shù),以及多媒體應(yīng)用技術(shù)這六個方面。而且還應(yīng)該包括多媒體同步 技術(shù)、多媒體操作系統(tǒng)技術(shù)、多媒體中間件技術(shù)、多媒體交換技術(shù)、多媒體數(shù)據(jù)庫技術(shù)、超 媒體技術(shù)、基于內(nèi)容檢索技術(shù)、多媒體通信中的QoS管理技術(shù)、多媒體會議系統(tǒng)技術(shù)、多媒 體視頻點播與交互電視技術(shù)、虛擬實景空間技術(shù)等等。
3.一般多媒體系統(tǒng)的組成部分
一般的多媒體系統(tǒng)由如下四個部分的內(nèi)容組成:
多媒體硬件系統(tǒng)、多媒體操作系統(tǒng)、媒體處理系統(tǒng)工具和用戶應(yīng)用軟件。
★ 多媒體硬件系統(tǒng):包括計算機硬件、聲音/視頻處理器、多種媒體輸入/輸出設(shè)備及信號轉(zhuǎn)換裝置、通信傳輸設(shè)備及接口裝置等。其中,最重要的是根據(jù)多媒體技術(shù)標(biāo)準(zhǔn)而研制生成的多媒體信息處理芯片和板卡、光盤驅(qū)動器等。
★ 多媒體操作系統(tǒng):或稱為多媒體核心系統(tǒng)(Multimedia kernel system),具有實時任務(wù)調(diào)度、多媒體數(shù)據(jù)轉(zhuǎn)換和同步控制對多媒體設(shè)備的驅(qū)動和控制,以及圖形用戶界面管理等。
★ 媒體處理系統(tǒng)工具:或稱為多媒體系統(tǒng)開發(fā)工具軟件,是多媒體系統(tǒng)重要組成部分。
★ 用戶應(yīng)用軟件:根據(jù)多媒體系統(tǒng)終端用戶要求而定制的應(yīng)用軟件或面向某一領(lǐng)域的用戶應(yīng)用軟件系統(tǒng),它是面向大規(guī)模用戶的系統(tǒng)產(chǎn)品。
第二篇 多媒體計算機的組成
1.多媒體個人機的解釋
在多媒體計算機之前,傳統(tǒng)的微機或個人機處理的信息往往僅限于文字和數(shù)字,只能算是計算機應(yīng)用的初級階段,同時,由于人機之間的交互只能通過鍵盤和顯示器,故交流信息的途徑缺乏多樣性。為了改換人機交互的接口,使計算機能夠集聲、文、圖、像處理于一體,人類發(fā)明了有多媒體處理能力的計算機。我們這里重點談?wù)剛€人機(就是現(xiàn)在說的PC啦)。所以現(xiàn)在你該明白,所謂多媒體個人機(Multimedia Personal Computer, MPC)無非就是具有了多媒體處理功能的個人計算機(如早期的586機型),它的硬件結(jié)構(gòu)與一般所用的個人機并無太大的差別,只不過是多了一些軟硬件配置而已。一般用戶如果要擁有MPC大概有兩種途徑:一是直接夠買具有多媒體功能的PC機;二是在基本的PC機上增加多媒體套件而構(gòu)成MPC。到奔Ⅱ橫行的今天,對計算機廠商和開發(fā)人員來說,MPC已經(jīng)成為一種必須具有的技術(shù)規(guī)范。
2.多媒體計算機的基本配置(及可選配置)
一般來說,多媒體個人計算機(MPC)的基本硬件結(jié)構(gòu)可以歸納為七部分:
★ 至少一個功能強大、速度快的中央處理器(CPU);
★ 可管理、控制各種接口與設(shè)備的配置;
★ 具有一定容量(盡可能大)的存儲空間;
★ 高分辨率顯示接口與設(shè)備;
★ 可處理音響的接口與設(shè)備;
★ 可處理圖像的接口設(shè)備;
★ 可存放大量數(shù)據(jù)的配置等;
這樣提供的配置是最基本MPC的硬件基礎(chǔ),它們構(gòu)成MPC的主機。除此以外,MPC能擴充的配置還可能包括如下幾個方面:
★ 光盤驅(qū)動器:包括可重寫光盤驅(qū)動器(CD-R)、WORM光盤驅(qū)動器和CD-ROM驅(qū)動器。其中CD-ROM驅(qū)動器為MPC帶來了價格便宜的650M存儲設(shè)備,存有圖形、動畫、圖像、聲音、文本、數(shù)字音頻、程序等資源的CD-ROM早已廣泛使用,因此現(xiàn)在光驅(qū)對廣大用戶來說已經(jīng)是必須配置的了。而可重寫光盤、WORM光盤價格較貴,目前還不是非常普及。另外,DVD出現(xiàn)在市場上也有些時日了,它的存儲量更大,雙面可達17GB,是升級換代的理想產(chǎn)品。
★ 音頻卡:在音頻卡上連接的音頻輸入輸出設(shè)備包括話筒、音頻播放設(shè)備、MIDI合成器、耳機、揚聲器等。數(shù)字音頻處理的支持是多媒體計算機的重要方面,音頻卡具有A/D和D/A音頻信號的轉(zhuǎn)換功能,可以合成音樂、混合多種聲源,還可以外接MIDI電子音樂設(shè)備。
★ 圖形加速卡:圖文并茂的多媒體表現(xiàn)需要分辨率高,而且同屏顯示色彩豐富的顯示卡的支持,同時還要求具有Windows的顯示驅(qū)動程序,并在Windows下的像素運算速度要快。所以現(xiàn)在帶有圖形用戶接口GUI加速器的局部總線顯示適配器使得Windows的顯示速度大大加快。
★ 視頻卡:可細分為視頻捕捉卡、視頻處理卡、視頻播放卡以及TV編碼器等專用卡,其功能是連接攝像機、VCR影碟機、TV等設(shè)備,以便獲取、處理和表現(xiàn)各種動畫和數(shù)字化視頻媒體。
★ 掃描卡:它是用來連接各種圖形掃描儀的,是常用的靜態(tài)照片、文字、工程圖輸入設(shè)備。
★ 打印機接口:用來連接各種打印機,包括普通打印機、激光打印機、彩色打印機等,打印機現(xiàn)在已經(jīng)是最常用的多媒體輸出設(shè)備之一了。
★ 交互控制接口:它是用來連接觸摸屏、鼠標(biāo)、光筆等人機交互設(shè)備的,這些設(shè)備將大大方便用戶對MPC的使用。
★ 網(wǎng)絡(luò)接口:是實現(xiàn)多媒體通信的重要MPC擴充部件。計算機和通信技術(shù)相結(jié)合的時代已經(jīng)來臨,這就需要專門的多媒體外部設(shè)備將數(shù)據(jù)量龐大的多媒體信息傳送出去或接收進來,通過網(wǎng)絡(luò)接口相接的設(shè)備包括視頻電話機、傳真機、LAN和ISDN等。
3.媒體播放器在WEB中的應(yīng)用
我們知道,由于聲音點播和影視點播應(yīng)用還沒有完全直接集成到現(xiàn)在的Web瀏覽器中,這就需要一個單獨的應(yīng)用程序來幫助,通常我們使用媒體播放器(Media player)來播放聲音和影視。典型的媒體播放器要執(zhí)行好幾個功能,包括解壓縮、消除抖動、錯誤糾正和用戶播放等功能?,F(xiàn)在可以使用像插件這種技術(shù)把媒體播放器的用戶接口放在Web客戶機的用戶界面上,瀏覽器在當(dāng)前Web頁面上保留屏幕空間,并且由媒體播放器來管理。目前,大多數(shù)客戶機使用如下幾種方法來讀取聲音和影視文件:
★ 通過Web瀏覽器把聲音/影視從Web服務(wù)器傳送給媒體播放器;
★ 直接把聲音/影視從Web服務(wù)器傳送給媒體播放器 ;
★ 直接把聲音/影視從多媒體流放服務(wù)器傳送給媒體播放器;
在這個過程中,媒體播放器的主要功能表現(xiàn)在如下四個方面:
★ 解壓縮:幾乎所有的聲音和電視圖象都是經(jīng)過壓縮之后存放在存儲器中的,因此無論播放來自于存儲器或者來自網(wǎng)絡(luò)上的聲音和影視都要解壓縮。
★ 去抖動:由于到達接收端的每個聲音信息包和電視圖象信息包的時延不是一個固定的數(shù)值,如果不加任何措施就原原本本地把數(shù)據(jù)送到媒體播放器播放,聽起來就會有抖動的感覺,甚至對聲音和電視圖象所表達的信息無法理解。在媒體播放器中,限制這種抖動的簡單方法是使用緩存技術(shù),就是把聲音或者電視圖象數(shù)據(jù)先存放在緩沖存儲器中,經(jīng)過一段延時之后再播放。
★ 錯誤處理:由于在因特網(wǎng)上往往會出現(xiàn)讓人不能接收的交通擁擠,信息包中的部分信息在傳輸過程中就可能會丟失。如果連續(xù)丟失的信息包太多,用戶接收的聲音和圖象質(zhì)量就不能容忍。采取的辦法往往是重傳。
★ 用戶可控制的接口:這是用戶直接控制媒體播放器播放媒體的實際接口。媒體播放器為用戶提供的控制功能通常包括聲音的音量大小、暫停/重新開始和跳轉(zhuǎn)等等。
第三篇 圖像和圖形
1.有關(guān)色彩的基本常識
我們知道,只要是彩色都可用亮度、色調(diào)和飽和度來描述,人眼中看到的任一彩色光都是這三個特征的綜合效果。那么亮度、色調(diào)和飽和度分別指的是什么呢?
★ 亮度:是光作用于人眼時所引起的明亮程度的感覺,它與被觀察物體的發(fā)光強度有關(guān);★ 色調(diào):是當(dāng)人眼看到一種或多種波長的光時所產(chǎn)生的彩色感覺,它反映顏色的種類,是決定顏色的基本特性,如紅色、棕色就是指色調(diào);
★ 飽和度:指的是顏色的純度,即摻入白光的程度,或者說是指顏色的深淺程度,對于同一色調(diào)的彩色光,飽和度越深顏色越鮮明或說越純。通常我們把色調(diào)和飽和度通稱為色度。 現(xiàn)在你該明白了,亮度是用來表示某彩色光的明亮程度,而色度則表示顏色的類別與深淺程度。除此之外,自然界常見的各種顏色光,都可由紅(R)、綠(G)、藍(B)三種顏色光按不同比例相配而成;同樣絕大多數(shù)顏色光也可以分解成紅、綠、藍三種色光,這就形成了色度學(xué)中最基本的原理----三原色原理(RGB)。
2.目前常見的圖形(圖像)格式
一般來說,目前的圖形(圖像)格式大致可以分為兩大類:一類為位圖;另一類稱為描繪類、矢量類或面向?qū)ο蟮膱D形(圖像)。前者是以點陣形式描述圖形(圖像)的,后者是以數(shù)學(xué)方法描述的一種由幾何元素組成的圖形(圖像)。一般說來,后者對圖像的表達細致、真實,縮放后圖形(圖像)的分辨率不變,在專業(yè)級的圖形(圖像)處理中運用較多。
在介紹圖形(圖像)格式前,我們實在有必要先了解一下圖形(圖像)的一些相關(guān)技術(shù)指標(biāo):分辨率、色彩數(shù)、圖形灰度。
★ 分辨率:分為屏幕分辨率和輸出分辨率兩種,前者用每英寸行數(shù)表示,數(shù)值越大圖形(圖像)質(zhì)量越好;后者衡量輸出設(shè)備的精度,以每英寸的像素點數(shù)表示;
★ 色彩數(shù)和圖形灰度:用位(bit)表示,一般寫成2的n次方,n代表位數(shù)。當(dāng)圖形(圖像)達到24位時,可表現(xiàn)1677萬種顏色,即真彩。灰度的表示法類似;
下面我們就通過圖形文件的特征后綴名(就是如圖.bmp這樣的)來逐一認識當(dāng)前常見的圖形文件格式:BMP、DIB、PCP、DIF、WMF、GIF、JPG、TIF、EPS、PSD、CDR、IFF、TGA、PCD、MPT。
★ BMP(bit map picture):PC機上最常用的位圖格式,有壓縮和不壓縮兩種形式,該格式可表現(xiàn)從2位到24位的色彩,分辨率也可從480x320至1024x768。該格式在Windows環(huán)境下相當(dāng)穩(wěn)定,在文件大小沒有限制的場合中運用極為廣泛。
★ DIB(device independent bitmap):描述圖像的能力基本與BMP相同,并且能運行于多種硬件平臺,只是文件較大。
★ PCP(PC paintbrush):由Zsoft公司創(chuàng)建的一種經(jīng)過壓縮且節(jié)約磁盤空間的PC位圖格式,它最高可表現(xiàn)24位圖形(圖像)。過去有一定市場,但隨著JPEG的興起,其地位已逐漸日落終天了。
★ DIF(drawing interchange formar):AutoCAD中的圖形文件,它以ASCII方式存儲圖形,表現(xiàn)圖形在尺寸大小方面十分精確,可以被CorelDraw,3DS等大型軟件調(diào)用編輯。
★ WMF(Windows metafile format):Microsoft Windows圖元文件,具有文件短小、圖案造型化的特點。該類圖形比較粗糙,并只能在Microsoft Office中調(diào)用編輯。
★ GIF(graphics interchange format):在各種平臺的各種圖形處理軟件上均可處理的經(jīng)過壓縮的圖形格式。缺點是存儲色彩最高只能達到256種。
★ JPG(joint photographics expert group):可以大幅度地壓縮圖形文件的一種圖形格式。對于同一幅畫面,JPG格式存儲的文件是其他類型圖形文件的1/10到1/20,而且色彩數(shù)最高可達到24位,所以它被廣泛應(yīng)用于Internet上的homepage或internet上的圖片庫。
★ TIF(tagged image file format):文件體積龐大,但存儲信息量亦巨大,細微層次的信息較多,有利于原稿階調(diào)與色彩的復(fù)制。該格式有壓縮和非壓縮兩種形式,最高支持的色彩數(shù)可達16M。
★ EPS(encapsulated PostScript):用PostScript語言描述的ASCII圖形文件,在PostScript圖形打印機上能打印出高品質(zhì)的圖形(圖像),最高能表示32位圖形(圖像)。該格式分為Photoshop EPS格式adobeillustrator EPS和標(biāo)準(zhǔn)EPS格式,其中后者又可以分為圖形格式和圖像格式。
★ PSD(photoshop standard):Photoshop中的標(biāo)準(zhǔn)文件格式,專門為Photoshop而優(yōu)化的格式。
★ CDR(coreldraw):CorelDraw的文件格式。另外,CDX是所有CorelDraw應(yīng)用程序均能使用的圖形(圖像)文件,是發(fā)展成熟的CDR文件。
★ IFF(image file format):用于大型超級圖形處理平臺,比如AMIGA機,好萊塢的特技大片多采用該圖形格式處理。圖形(圖像)效果,包括色彩紋理等逼真再現(xiàn)原景。當(dāng)然,該格式耗用的內(nèi)存外存等的計算機資源也十分巨大。
★ TGA(tagged graphic):是True vision公司為其顯示卡開發(fā)的圖形文件格式,創(chuàng)建時期較早,最高色彩數(shù)可達32位。VDA,PIX,WIN,BPX,ICB等均屬其旁系。
★ PCD(Photo CD):由KODAK公司開發(fā),其它軟件系統(tǒng)對其只能讀取。
★ MPT(macintosh paintbrush)或MAC:Macintosh機所使用的灰度圖形(圖像)模式,在macintosh paintbrush中使用,其分辨率只能是720x567。
除此之外,Macintosh機專用的圖形(圖像)格式還有PNT、PICT、PICT2等。
第四篇 聲音(音頻)
1.多媒體中的音頻處理技術(shù)
多媒體涉及到多方面的音頻處理技術(shù),如:音頻采集、語音編碼/解碼、文一-語轉(zhuǎn)換、音樂合成、語音識別與理解、音頻數(shù)據(jù)傳輸、音頻一-視頻同步、音頻效果與編輯等。其中數(shù)字音頻是個關(guān)鍵的概念,它指的是一個用來表示聲音強弱的數(shù)據(jù)序列,它是由模擬聲音經(jīng)抽樣(即每隔一個時間間隔在模擬聲音波形上取一個幅度值)量化和編碼(即把聲音數(shù)據(jù)寫成計算機的數(shù)據(jù)格式)后得到的。計算機數(shù)字CD、數(shù)字磁帶(DAT)中存儲的都是數(shù)字聲音。模擬一-數(shù)字轉(zhuǎn)換器把模擬聲音變成數(shù)字聲音;數(shù)字一-模擬轉(zhuǎn)換器可以恢復(fù)出模擬來的聲音。
一般來講,實現(xiàn)計算機語音輸出有兩種方法:一是錄音/重放,二是文一-語轉(zhuǎn)換。第二種方法是基于聲音合成技術(shù)的一種聲音產(chǎn)生技術(shù),它可用于語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產(chǎn)生了應(yīng)用調(diào)頻(FM)音樂合成技術(shù)和波形表(wavetable)音樂合成技術(shù)。
2.樂器數(shù)字接口MIDI的概念
現(xiàn)在我們用的最多的音頻名詞之一MIDI(musical instrument digital interface)是作為“樂器數(shù)字接口”的縮寫出現(xiàn)的,并用它來泛指數(shù)字音樂的國際標(biāo)準(zhǔn)。由于它定義了計算機音樂程序、合成器及其他電子設(shè)備交換信息和電子信號的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標(biāo)準(zhǔn)的多媒體PC平臺能夠通過內(nèi)部合成器或連接到計算機MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音樂,所需的存儲量最少。
至于MIDI文件,是指存放MIDI信息的標(biāo)準(zhǔn)文件格式。MIDI文件中包含音符、定時和多達16個通道的演奏定義。文件包括每個通道的演奏音符信息:鍵通道號、音長、音量和力度(擊鍵時,鍵達到最低位置的速度)。由于MDDI文件是一系列指令,而不是波形,它需要的磁盤空間非常少;并且現(xiàn)裝載MIDI文件比波形文件容易的多。這樣,在設(shè)計多媒體節(jié)目時,我們可以指定什么時候播放音樂,將有很大的靈活性。在以下幾種情況下,使用MIDI文件比使用波形音頻更合適:需要播放長時間高質(zhì)量音樂,如想在硬盤上存儲的音樂大于4分鐘,而硬盤又沒有足夠的存儲容量;需要以音樂作背景音響效果,同時從CD-ROM中裝載其它數(shù)據(jù),如圖像、文字的顯示;需要以音樂作背景音響效果,同時播放波形音頻或?qū)崿F(xiàn)文一語轉(zhuǎn)換,以實現(xiàn)音樂和語音的同時輸出。
3.常見的聲音文件格式
再接下來我們介紹七種目前最為流行的多媒體聲音文件效果讓你認識認識:
★ WAVE,擴展名為WAV:該格式記錄聲音的波形,故只要采樣率高、采樣字節(jié)長、機器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質(zhì)量非常高,但這樣做的代價就是文件太大。
★ MOD,擴展名MOD、ST3、XT、S3M、FAR、669等:該格式的文件里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確,音色種類無限等優(yōu)點。但它也有一些致命弱點,以至于現(xiàn)在已經(jīng)逐漸淘汰,目前只有MOD迷及一些游戲程序中尚在使用。
★ MPEG-3,擴展名MP3:現(xiàn)在最流行的聲音文件格式,因其壓縮率大,在網(wǎng)絡(luò)可視電話通信方面應(yīng)用廣泛,但和CD唱片相比,音質(zhì)不能令人非常滿意。
★ Real Audio,擴展名RA:這種格式真可謂是網(wǎng)絡(luò)的靈魂,強大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網(wǎng)絡(luò)傳輸帶寬資源而設(shè)計的,因此主要目標(biāo)是壓縮比和容錯性,其次才是音質(zhì)。
★ Creative Musical Format,擴展名CMF:Creative公司的專用音樂格式,和MIDI差不多,只是音色、效果上有些特色,專用于FM聲卡,但其兼容性也很差。
★ CD Audio音樂CD,擴展名CDA:唱片采用的格式,又叫“紅皮書”格式,記錄的是波形流,絕對的純正、HIFI。但缺點是無法編輯,文件長度太大。
★ MIDI,擴展名MID:目前最成熟的音樂格式,實際上已經(jīng)成為一種產(chǎn)業(yè)標(biāo)準(zhǔn),其科學(xué)性、兼容性、復(fù)雜程度等各方面當(dāng)然遠遠超過本文前面介紹的所有標(biāo)準(zhǔn)(除交響樂CD、Unplug CD外,其它CD往往都是利用MIDI制作出來的),它的General MIDI就是最常見的通行標(biāo)準(zhǔn)。作為音樂工業(yè)的數(shù)據(jù)通信標(biāo)準(zhǔn),MIDI能指揮各音樂設(shè)備的運轉(zhuǎn),而且具有統(tǒng)一的標(biāo)準(zhǔn)格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且文件的長度非常小。
總之,如果有專業(yè)的音源設(shè)備,那么要聽同一首曲子的HIFI程度依次是:
原聲樂器演奏 〉 MIDI 〉 CD唱片 〉 MOD 〉 所謂聲卡上的MIDI 〉 CMF,而MP3及RA要看它的節(jié)目源是采用MIDI、CD還是MOD了。
另外,在多媒體材料中,存儲聲音信息的文件格式也是需要認識的,共有:
WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干種。
★ WAV文件:Microsoft公司的音頻文件格式,它來源于對聲音模擬波形的采樣。用不同的采樣頻率對聲音的模擬波形進行采樣可以得到一系列離散的采樣點,以不同的量化位數(shù)(8位或16位)把這些采樣點的值轉(zhuǎn)換成二進制數(shù),然后存入磁盤,這就產(chǎn)生了聲音的WAV文件,即波形文件。Microsoft Sound System軟件Sound Finder可以轉(zhuǎn)換AIF SND和VOD文件到WAV格式。
★ VOC文件:Creative公司波形音頻文件格式,也是聲霸卡(sound blaster)使用的音頻文件格式。每個VOC文件由文件頭塊(header block)和音頻數(shù)據(jù)塊(data block)組成。文件頭包含一個標(biāo)識版本號和一個指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類型的子塊。如聲音數(shù)據(jù)靜音標(biāo)識ASCII碼文件重復(fù)的結(jié)果重復(fù)以及終止標(biāo)志,擴展塊等。
★ MIDI文件:Musical Instrument Digital Interface(樂器數(shù)字接口)的縮寫。它是由世界上主要電子樂器制造廠商建立起來的一個通信標(biāo)準(zhǔn),以規(guī)定計算機音樂程序 電子合成器和其它電子設(shè)備之間交換信息與控制信號的方法。MIDI文件中包含音符定時和多達16個通道的樂器定義,每個音符包括鍵通道號持續(xù)時間音量和力度等信息。所以MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令。
★ RMI文件:Microsoft公司的MIDI文件格式,它可以包括圖片標(biāo)記和文本。
★ PCM文件:模擬音頻信號經(jīng)模數(shù)轉(zhuǎn)換(A/D變換)直接形成的二進制序列,該文件沒有附加的文件頭和文件結(jié)束標(biāo)志。在聲霸卡提供的軟件中,可以利用VOC-HDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的文件轉(zhuǎn)換成Microsoft的WAV格式的文件。
★ AIF文件:Apple計算機的音頻文件格式。Windows的Convert工具同樣可以把AIF格式的文件換成Microsoft的WAV格式的文件。
第五篇 視頻(動畫)
1.動態(tài)圖像的組成
動態(tài)圖像,包括動畫和視頻信息,是連續(xù)漸變的靜態(tài)圖像或圖形序列,沿時間軸順次更換顯示,從而構(gòu)成運動視感的媒體。當(dāng)序列中每幀圖像是由人工或計算機產(chǎn)生的圖像時,我們常稱作動畫;當(dāng)序列中每幀圖像是通過實時攝取自然景象或活動對象時,我們常成為影像視頻,或簡稱為視頻。動態(tài)圖像演示常常與聲音媒體配合進行,二者的共同基礎(chǔ)是時間連續(xù)性。一般意義上談到視頻時,往往也包含聲音媒體。但在這里,視頻(動畫)特制不包含聲音媒體的動態(tài)圖像。
2.動畫的定義
什么是動畫?所謂動畫,就是通過以每秒15到20幀的速度(相當(dāng)接近于全運動視頻幀速)順序地播放靜止圖像幀以產(chǎn)生運動的錯覺。因為眼睛能足夠長時間地保留圖像以允許大腦以連續(xù)的序列把幀連接起來,所以能夠產(chǎn)生運動的錯覺。我們可以通過在顯示時改變圖像來生成簡單的動畫。最簡單的方法是在兩個不同幀之間的反復(fù)。這種方法對于指示“是”或“不是”的情況來說是很好的解決方法。另一種制作動畫的方法是以循環(huán)的形式播放幾個圖像幀以生成旋轉(zhuǎn)的效果,并且可以依靠計算時間來獲得較好的回放,或用記時器來控制動畫。
3.常見的視頻文件格式
視頻信息在計算機中存放的格式有很多,目前最流行的兩種格式是:
蘋果公司的Quicktime和微軟的AVI。
★ Quicktime:是蘋果公司采用的面向最終用戶桌面系統(tǒng)的低成本、全運動視頻的方式,現(xiàn)在在軟件壓縮和解壓縮中也開始采用這種方式了。其向量量化是Quicktime軟件的壓縮技術(shù)之一,它在最高為30幀/秒下提供的視頻分辨率是320x240,其壓縮率能從25到200。
★ AVI:類似于Quicktime,是微軟公司采用的音頻視頻交錯格式,也是一種桌面系統(tǒng)上的低成本、低分辨率的視頻格式。AVI可在160x120的視窗中以15幀/秒回放視頻,并可帶有8位的聲音,也可以在VGA或超級VGA監(jiān)視器上回放。AVI很重要的一個特點是可伸縮性,使用AVI算法時的性能依賴于與它一起使用的基礎(chǔ)硬件。
第六篇 多媒體數(shù)據(jù)壓縮和編碼技術(shù)標(biāo)準(zhǔn)
目前,被國際社會廣泛認可和應(yīng)用的通用壓縮編碼標(biāo)準(zhǔn)大致有如下四種:
H.261、JPEG、 MPEG和DVI。
★ H.261:由CCITT(國際電報電話咨詢委員會)通過的用于音頻視頻服務(wù)的視頻編碼解碼器(也稱Px64標(biāo)準(zhǔn)),它使用兩種類型的壓縮:一幀中的有損壓縮(基于DCT)和用于幀間壓縮的無損編碼,并在此基礎(chǔ)上使編碼器采用帶有運動估計的DCT和DPCM(差分脈沖編碼調(diào)制)的混合方式。這種標(biāo)準(zhǔn)與JPEG及MPEG標(biāo)準(zhǔn)間有明顯的相似性,但關(guān)鍵區(qū)別是它是為動態(tài)使用設(shè)計的,并提供完全包含的組織和高水平的交互控制。
★ JPEG:全稱是Joint Photogragh Coding Experts Group(聯(lián)合照片專家組),是一種基于DCT的靜止圖像壓縮和解壓縮算法,它由ISO(國際標(biāo)準(zhǔn)化組織)和CCITT(國際電報電話咨詢委員會)共同制定,并在1992年后被廣泛采納后成為國際標(biāo)準(zhǔn)。它是把冗長的圖像信號和其它類型的靜止圖像去掉,甚至可以減小到原圖像的百分之一(壓縮比100:1)。但是在這個級別上,圖像的質(zhì)量并不好;壓縮比為20:1時,能看到圖像稍微有點變化;當(dāng)壓縮比大于20:1時,一般來說圖像質(zhì)量開始變壞。
★ MPEG:是Moving Pictures Experts Group(動態(tài)圖像專家組)的英文縮寫,實際上是指一組由ITU和ISO制定發(fā)布的視頻、音頻、數(shù)據(jù)的壓縮標(biāo)準(zhǔn)。它采用的是一種減少圖像冗余信息的壓縮算法,它提供的壓縮比可以高達200:1,同時圖像和音響的質(zhì)量也非常高?,F(xiàn)在通常有三個版本:MPEG-1、MPEG-2、MPEG-4以適用于不同帶寬和數(shù)字影像質(zhì)量的要求。它的三個最顯著優(yōu)點就是兼容性好、壓縮比高(最高可達200:1)、數(shù)據(jù)失真小。
★ DVI:其視頻圖像的壓縮算法的性能與MPEG-1相當(dāng),即圖像質(zhì)量可達到VHS的水平,壓縮后的圖像數(shù)據(jù)率約為1.5Mb/s。為了擴大DVI技術(shù)的應(yīng)用,Intel公司最近又推出了DVI算法的軟件解碼算法,稱為Indeo技術(shù),它能將為壓縮的數(shù)字視頻文件壓縮為五分之一到十分之一。
第七篇 多媒體工具綜述
1.多媒體創(chuàng)作工具
多媒體創(chuàng)作系統(tǒng)介于多媒體操作系統(tǒng)與應(yīng)用軟件之間,是支持應(yīng)用開發(fā)人員進行多媒體應(yīng)用軟件創(chuàng)作的工具,故又稱為多媒體創(chuàng)作工具。它能夠用來集成各種媒體,并可設(shè)計閱讀信息內(nèi)容方式的軟件。借助這種工具,應(yīng)用人員可以不用編程也能做出很優(yōu)秀的多媒體軟件產(chǎn)品,極大的方便了用戶。與之對應(yīng),多媒體創(chuàng)作工具必須擔(dān)當(dāng)起可視化編程的責(zé)任,它必須具有概念清晰、界面簡潔、操作簡單、功能伸縮性強等特點。目前,對優(yōu)秀的多媒體創(chuàng)作工具的判斷標(biāo)準(zhǔn)是,應(yīng)該具備以下八種基本的能力并能夠不斷進行增強:
★ 編輯能力及環(huán)境;
★ 媒體數(shù)據(jù)輸入能力;
★ 交互能力;
★ 功能擴充能力;
★ 調(diào)試能力;
★ 動態(tài)數(shù)據(jù)交換能力;
★ 數(shù)據(jù)庫功能;
★ 網(wǎng)絡(luò)組件及模板套用能力。
從系統(tǒng)工具的功能角度劃分,多媒體創(chuàng)作工具大致可以分為四類:
媒體創(chuàng)作軟件工具、多媒體節(jié)目寫作工具、媒體播放工具以及其他各類媒體處理工具。
★ 媒體創(chuàng)作軟件工具: 用于建立媒體模型、產(chǎn)生媒體數(shù)據(jù)。
應(yīng)用較廣泛的有三維圖形視覺空間的設(shè)計和創(chuàng)作軟件,如Macromedia公司的Extreme 3D,它能提供包括建模、動畫、渲染以及后期制作等諸多功能,直至專業(yè)級視頻制作。另外,Autodesk公司的2D Animation和3D Studio(包括3D Max)等也是很受歡迎的媒體創(chuàng)作工具。而用于MIDI文件(數(shù)字化音樂接口標(biāo)準(zhǔn))處理的音序器軟件非常多,比較有名的有Music Time、Recording Session、Master Track Pro和Studio for windows等;至于波形聲音工具,在MDK(多媒體開放平臺)中的Wave Edit、Wave Studio等就相當(dāng)不錯。
★ 多媒體節(jié)目寫作工具: 提供不同的編輯、寫作方式。
第一種是基于腳本語言的寫作工具,典型的如Toolbook,它能幫助創(chuàng)作者控制各種媒體數(shù)據(jù)的播放,其中OpenScript語言允許對Windows的MCI(媒體控制接口)進行調(diào)用,控制各類媒體設(shè)備的播放或錄制。第二類是基于流程圖的寫作工具,典型的如Authorware和IconAuther,它們使用流程圖來安排節(jié)目,每個流程圖由許多圖標(biāo)組成,這些圖標(biāo)扮演腳本命令的角色,并與一個對話框?qū)?yīng),在對話框輸入相應(yīng)內(nèi)容即可。第三類寫作工具是基于時序的,典型的如Action,它們是通過將元素和是檢驗時間軸線安排來達到使多媒體內(nèi)容演示的同步控制。
★ 媒體播放工具: 可以在電腦上播出,有的甚至能在消費類電子產(chǎn)品中播出。
這一類軟件非常多,其中Video for Windows,就可以對視頻序列(包括伴音)進行一系列處理,實現(xiàn)軟件播放功能。而Intel公司推出的Indeo在技術(shù)上更進了一步,在純軟件視頻播放上,還提供了功能先進的制作工具。
★ 其他各類媒體處理工具
除了三大類媒體開發(fā)工具外,還有其他幾類軟件,如多媒體數(shù)據(jù)庫管理系統(tǒng)、Video-CD制作節(jié)目工具、基于多媒體板卡(如MPEG卡)的工具軟件、多媒體出版系統(tǒng)工具軟件、多媒體CAI制作工具、各式MDK(多媒體開放平臺)等。它們在各領(lǐng)域中都受到很大歡迎。
2.多媒體應(yīng)用工具
上面介紹的大多數(shù)都是大型的多媒體系統(tǒng)開發(fā)工具軟件,在桌面電腦中也許用到的時候不多,下面從家用PC的角度介紹幾款現(xiàn)在最為流行的多媒體應(yīng)用軟件。
★ 圖形制作和圖像瀏覽工具
在圖形(圖像)領(lǐng)域里,最出色的工具軟件要算Adobe PhotoShop和3DS MAX了,它們可以算是真正的設(shè)計大師。除此之外,還有專業(yè)級的圖形(圖像)處理軟件CorelDraw和Freehand。如果用戶需要傻瓜一點的工具,則可能友立公司出品的PhotoImpact和Cool 3D會更適合,前者內(nèi)建了神奇的百寶箱,能讓使用者輕松的編輯出相當(dāng)具水準(zhǔn)的各種效果圖片,后者可以非常輕松的制作出很酷的立體字和GIF動畫圖,甚至是各種效果的標(biāo)題、對象、標(biāo)志等等。另外,微軟麾下的Office套件----Photo Edit和FrontPage伴侶----Image等也能為眾多多媒體用戶分憂。至于圖片(圖像)瀏覽軟件,DOS模式下有“德國戰(zhàn)車”----Sea,Windows環(huán)境下有大名鼎鼎的ACDSee。另外,CompuPic和PicView也是值得考慮的高性能看圖軟件。這幾種軟件除了有瀏覽功能外,還可進行圖形(圖像)格式、分辨率、色彩數(shù)的轉(zhuǎn)換,使用起來也特別的方便。
★ 媒體播放和音頻工具
除了上面介紹的Video for Windows可以用外,還有Multimedia Xplorer等也是不錯的軟件。但在家用中,我們對媒體播放的應(yīng)用可能更多的還停留在MP3、CD等音樂文件的播放上,所以重點介紹一下。說到MP3播放,自然是著名的Winamp一統(tǒng)天下了。這個著名的高保真音樂播放軟件最優(yōu)秀之處在于其強大的功能和出色的音質(zhì),而且它還可以定制界面skins,并能支持增強音頻視覺和音頻效果的Plug-ins。還有較好的MP3播放軟件是Soritong和Sonique。如果用戶要從網(wǎng)上收聽(收看)實時Audio、Video和Flash的話,RealPlayer是個絕好的工具,特別是最新的RealSystem G2。
至于那些對音樂有著特殊愛好的多媒體用戶,多媒體播放軟件中的先驅(qū)Jet-Audio和目前最成熟的軟波表合成器Jet-MIDI實在該是上選。它們都是韓國公司COWON的產(chǎn)品,界面華麗、音色絕佳,支持的多媒體格式更是多達20幾種,完全可與著名的Audio Station相媲美,而后者最秒之處是提供了“State-of-the-art”----藝術(shù)級的波表模擬,只要擁有一塊16位的聲卡,就可以實現(xiàn)具有音樂會般臨場感的MIDI回放,體驗高保真音響帶來的聽覺震撼!另外,倘若用戶要找一個工具軟件集音樂播放器和多媒體文件管理器于一身,倒是可以用用MidiMaster 2000,現(xiàn)在大概不容易找到更好的音樂庫管理軟件了。
★ 視頻播放工具
視頻播放在家用中,當(dāng)然是看VCD或DVD了。這類軟件最好用的大概是豪杰超級解霸,梁肇新先生的這款軟件是很多MPC裝機者必備的視頻播放工具,在目前的媒體播放軟件中,號稱無出其右者。這之中或許還有些用戶使用的Windows98第二版會與超級解霸沖突,如果沒有為此而打補丁的話,就可以用用WinDVD 和Power DVD。用它們一樣可以播放MPEG、VCD、DVD碟或其它視頻文檔,而且控制功能也很完善,播放速度一流。至于著名的QuickTime,在這里可不再是蘋果公司的一種視頻信息格式了,而是可以用來在線瀏覽MOV電影檔和QuickTime VR的虛擬實境網(wǎng)頁的視頻播放工具,至于播放MOV文件和AVI等文件,自然是不在話下了!