計算機多媒體技術(shù)的應用現(xiàn)狀
近年來.多媒體技術(shù)得到迅速發(fā)展,多媒體系統(tǒng)的應用更以極強的滲透力進人人類生活的各個領(lǐng)域。在現(xiàn)有的技術(shù)應用巾,多媒體技術(shù)是炙手可熱的領(lǐng)域,新手段、新現(xiàn)象每天都出現(xiàn),所帶來的新感覺、新體驗是以往任何時候都無法想象的。人類的工作和生活的方方面面都感覺到它所帶來的變化。
1 多媒體數(shù)據(jù)處理技術(shù)的應用
(1)視頻技術(shù)。視頻技術(shù)包括視頻數(shù)字化和視頻編碼技術(shù)兩個方面。視頻數(shù)字化是將模擬視頻信號經(jīng)模數(shù)轉(zhuǎn)換和彩色空間變換轉(zhuǎn)為計算機可處理的數(shù)字信號,使得計算機可以顯示和處理視頻信號。視頻編碼技術(shù)是將數(shù)字化的視頻信號經(jīng)過編碼成為視頻信號,從而可以錄制或播放。對于不同的應用環(huán)境有不同的技術(shù)可以采用.例如.電視臺廣播級的
編碼技術(shù)。
(2)音頻技術(shù)。音頻技術(shù)主要包括4個方面:音頻數(shù)字化、語音處理語音合成及語音識別。音頻技術(shù)發(fā)展較早,一些技術(shù)已經(jīng)成熟并產(chǎn)品化,已經(jīng)大量進入了家庭。越來越多的聲像信息以數(shù)字形式存儲和傳輸,這為人們更靈活地使州這些信息提供了可能性。語音的識別長久以來一直是人們的美好夢想,讓計算機聽懂人說話是發(fā)展人機語音通信和新一代智能計算機的主要目標。隨著計算機的普及.越來越多的人在使用計算機,如何給不熟悉計算機的人提供一個友好的人機交互手段.是人們感興趣的問題,而語音識圳技術(shù)就是其中最自然的一種交流手段。當前,語音識別領(lǐng)域的研究正方興未艾。存這方面的新算法、新思想和新的應用系統(tǒng)不斷涌現(xiàn)。同時,語音識圳領(lǐng)域也正處在一個非常關(guān)鍵的時期,世界各國的研究人員正在向語音識別的最高層次應用——非特定人、大同匯量、連續(xù)語音的聽寫機系統(tǒng)的研究和文 化系統(tǒng)進行沖刺,可以樂觀地說.人們所期望的語音識別技術(shù)實川化的夢想很快就會變成現(xiàn)實、目前.世界上已研制出漢、英、日、法、德等語種的文語轉(zhuǎn)換系統(tǒng),并存許多領(lǐng)域得到了廣泛應用。
(3)數(shù)據(jù)壓縮技術(shù) 數(shù)據(jù)壓縮技術(shù)包括圖像、視頻和音頻信號的壓縮,文件存儲和利用。圖像壓縮一直是技術(shù)熱點之一,是計算機處理同像和視頻以及網(wǎng)絡傳輸?shù)闹匾A(chǔ), 目前ISO制訂了兩個壓縮標準即JPEG和MPEG,同時使計箅機實時處理音頻、視頻信息,以保證播高質(zhì)量的視頻、音頻節(jié)目。
(4)虛擬現(xiàn)實。多媒體計算機和仿真技術(shù)結(jié)合可以產(chǎn)生一種仿佛使人置身其中的虛擬世界巾,對其真實毫不懷疑,通常把這種技術(shù)稱之為“虛擬現(xiàn)實”(V tual Reality,簡稱VR)。換句話說,虛擬現(xiàn)實是由多媒體技術(shù)與仿真技術(shù)相結(jié)合而生成的一種交互式人工世界,在這個人工世界中可以創(chuàng)造一種身臨其境的完全真實的感覺。日前VR技術(shù)還主要是應用于少數(shù)高難度的軍事和醫(yī)療以及一些研究部門,但是存教育與訓練領(lǐng)域VR技術(shù)有不可替代的非常令人鼓舞的應川前景,所以這一發(fā)展趨勢也應引起我們的注意。例如,達特茅斯醫(yī)學院所開發(fā)的一種“交互式多媒體虛擬現(xiàn)實系統(tǒng)”,可以使醫(yī)務工作者體驗到并學習到如何對各種戰(zhàn)地醫(yī)療的實際情況作出反應。利用該系統(tǒng)的實習者可以感受到由計箅機仿真所產(chǎn)生的各種傷病員的危險癥狀,實習者可以從系統(tǒng)中選擇某種操作規(guī)程對當前的傷病情況進行處理, 可立即看到這種處理方式所產(chǎn)生的結(jié)果。為了使實習者獲得更深刻的體驗,系統(tǒng)還可仿真各種外科手術(shù),其內(nèi)容包括一般的開刀直至復雜的人體器官替換。
計算機多媒體通信技術(shù)的應用
(1)多媒體數(shù)據(jù)的壓縮編碼。多媒體系統(tǒng)中需要對多媒體數(shù)據(jù)進行捕獲、存儲、傳輸和播放等處理工作.數(shù)據(jù)壓縮技術(shù)是多媒體通信技術(shù)的核心問題之一。先進的數(shù)據(jù)壓縮技術(shù)尤其是視頻壓縮技術(shù)可實現(xiàn)較低的時延和高的壓縮比,達到較好的圖像質(zhì)量.這正是多媒體視聽業(yè)務能被廣泛接受的主要閑素之一。國際標準化組織(ISO)、國際電工委員會(IEC)、國際信聯(lián)盟【ITU)制定了一系列的視頻壓縮編碼標準。隨著多媒體業(yè)務的不斷發(fā)展,新的視頻和音頻壓縮編碼標準不斷涌現(xiàn).適用范圍逐漸擴大,壓縮效率大大提高.從而使多媒體通信逐漸應用到日常生活的各個領(lǐng)域。
(2)多媒體數(shù)據(jù)的同步, 存多媒體通信括術(shù)領(lǐng)域.同步技術(shù)十分重要 目前,多媒體技術(shù)可越多,計算機系統(tǒng)的相應處理子系統(tǒng)也越多,處理這些媒體之間的同步問題也就越復雜 分布式多媒體系統(tǒng)巾的同步要求主要可分為多媒體通信同步、多媒體表現(xiàn)同步及多媒體交互同步等 這些同步功能表現(xiàn)為多媒體同步體系結(jié)構(gòu)中的不同層次的同步要求。
(3)多媒體數(shù)據(jù)庫。在l983年第幾屑國際超大規(guī)模數(shù)據(jù)庫會議上,D.Tsichritzis等人就提jn了多媒體數(shù)據(jù)庫的概念。近年來由于數(shù)據(jù)壓縮、海量存儲、寬帶網(wǎng)絡、高速汁算機技術(shù)的發(fā)展,使得多媒體很快成為汁箅機和通信行業(yè)的熱點,而數(shù)據(jù)庫作為信息管理的有效手段也成了多媒體研究的重要方向之一。
(4)多媒體通信網(wǎng)。通信網(wǎng)絡是多媒體應川的傳輸環(huán)境,多媒體通信對信息的傳輸和交換都提出了新的更高的要求,網(wǎng)絡的帶寬、交換方式及通信協(xié)議都將直接影響能否提供多媒體通信業(yè)務與多媒體通信的質(zhì)量。
人工智能多媒體應用
人工智能是20世紀50年代后期興起的利川電子計算機模擬人類智力活動的科研領(lǐng)域,即由機器代替人的智能來完成某些丁作。它和多媒體結(jié)合的一些成果已存工業(yè)、商業(yè)、軍事、醫(yī)學和文化教育等方面得到應用人工智能多媒體技術(shù)涉及計算機輔助系統(tǒng)、智能信息系統(tǒng),多媒體智能監(jiān)控技術(shù)等。
(1)計算機輔助系統(tǒng)。根據(jù)一定的目標,在計算機上編制一系列的程序,設計和控制過程,使用者通過使用該程序,完成任務,這一系列計算機程序稱為計算機輔助軟件(Computer Assist,計算機輔助)。
(2)智能信息系統(tǒng)。智能信息系統(tǒng)是獲取、處理、應用信息的,主要應用信息領(lǐng)域。與語音圖像處理技術(shù)比較,智能軟件起點較高,應用的專業(yè)程度相對也較高,隨著計算機技術(shù)的發(fā)展,智能信息技術(shù)逐步形成為一門新的發(fā)展方向。
(3)多媒體智能監(jiān)控技術(shù)。智能化網(wǎng)像處理、聲音處理、檢索查詢等多媒體技術(shù)綜合應川到文時監(jiān)控系統(tǒng)巾,大大提高了系統(tǒng)功能,使監(jiān)控系統(tǒng)更廣泛地應用到生產(chǎn)、交通、安全、管理、教育、服務、科技、軍事等領(lǐng)領(lǐng)域。它能夠及時應對各種復雜情況,迅速作出反應,同時將信息存儲到數(shù)據(jù)庫巾以備查詢,并交互地綜合同 文、聲、動l研多種媒體信息,使監(jiān)控的表現(xiàn)形式更為生動、直觀,人機界面更為友好。
計算機多媒體技術(shù)的發(fā)展前景
計算機多媒體技術(shù)的發(fā)展前景有3個方面:多媒體技術(shù)集成化、多媒體終端的智能化和嵌人化、網(wǎng)絡化發(fā)展。
計算機多媒體技術(shù)集成化
在傳統(tǒng)的計算機應用中,大多數(shù)都采用文本媒體.所以對信息的表達僅限于“顯示”。存未來的多媒體環(huán)境下,各種媒體并存,視覺、聽覺、觸覺、味覺和嗅覺媒體信息的綜合與合成,就不能僅僅用“ 表示”完成媒體的表現(xiàn)了。各種媒體的時空安排和效應.相互之間的同步和合成效果,相互作川的解釋和描述等都是表達信息 影視聲響技術(shù)廣泛應用,使多媒體的時空合成、同步效果,可視化、可聽化以及靈活的交互方法等是多媒體領(lǐng)域的發(fā)展方向 多媒體交互技術(shù)的發(fā)展,使多媒體技術(shù)存模式識別、全息圖像、 然語言理解(語音識別與合成)和新的傳感技術(shù)等基礎(chǔ)上.利用人的多種感覺通道和動作通道(如講音、書寫、表情、姿勢、視線、動作和嗅覺等).通過數(shù)據(jù)傳輸和特殊的表達方式.如感知人的面部特征,合成面部動作和表情.以并行和非精確方式與計算機系統(tǒng)進行交互??梢蕴岣呷藱C交互的必然性和高效性.實現(xiàn)逼真?為標志的虛擬現(xiàn)實。虛擬現(xiàn)實是人們通過計箅機對復雜數(shù)據(jù)進行可視化操作與交互的一種全新方式.與傳統(tǒng)的人機界面以及流行的視窗操作相比.虛擬現(xiàn)實存技術(shù)思想上有了質(zhì)的飛躍 ,虛擬現(xiàn)實中的“現(xiàn)實”是泛指存物理意義上或功能意義上存存于世界上的任何事物或環(huán)境,它可以是實際上可文現(xiàn)的,也可以是文際上難以實現(xiàn)的或根本無法實現(xiàn)的。虛擬現(xiàn)實是一種多技術(shù)來。交互性是虛擬現(xiàn)實的交質(zhì)性特 ,對時空環(huán)境的現(xiàn)實構(gòu)想(即扁發(fā)思維、獲取信息的過程是虛擬現(xiàn)實的最終目的。 從虛擬現(xiàn)實技術(shù)誕生以來,它已經(jīng)在軍事模擬、先進制造、城市規(guī)劃、地理信息系統(tǒng)、醫(yī)學生物等領(lǐng)域中應用;巨大的經(jīng)濟、軍事和社會效益,并被稱為2l世紀最具應州前景的技術(shù)。
多媒體終端的智能化和嵌入化
現(xiàn)在計算機的“智力”已經(jīng)很高,將多媒體計箅機系統(tǒng)本身的多媒體性能提高,與此同時,將計箅機芯片嵌入各種家刪電器巾,開發(fā)智能化家電是一個發(fā)展前景。目前多媒體計算機硬件體系結(jié)構(gòu)、軟件不斷改進,尤其是采用了硬件體系結(jié)構(gòu)設計和軟件、箅法相結(jié)合的方案,使多媒體計算機的性能指標進一步提高,使多媒體終端設備具有更高的智能化,對多媒體終端增加如文字的識別和輸入、漢語語音的識別和輸入、自然語言理解和機器翻譯、圖形的識別和理解、機器人視覺和汁算機視覺等智能。嵌入式多媒體系統(tǒng)可應用在人們生活與工作的各個方面,在工業(yè)控制和商業(yè)管理領(lǐng)域,如智能工控設備、POS/ATM機、Ic卡等;在家庭領(lǐng)域,如數(shù)字機頂盒、數(shù)字式電視、網(wǎng)絡冰箱、網(wǎng)絡空淵等消費類電子產(chǎn)品,以及已flI現(xiàn)的家庭(住宅)中央控制系統(tǒng)等。此外,嵌入式多媒體系統(tǒng)還在醫(yī)療類電子設備、多媒體手機、掌上電腦、車載導航器、娛樂、軍事方面等領(lǐng)域有著巨大的應用前景。從目前的發(fā)展前景看可以把集成電路芯片分成兩類:一類是以多媒體和通信功能為主,融合CPU芯片的計算功能,它的設計目標是用在多媒體和通信設備,家電及寬帶通信設備,可以取代這些設備中的CPU及大量ASIC和其他芯片。另一類是以通用CPU計箅功能為主,融合多媒體和通信功能,它們的設計目標是與現(xiàn)有的計算機系列兼容,同時具有多媒體和通信功能,主要用在多媒體計算中。在目前,“信息家電平臺”的概念.已經(jīng)使多媒體終端集互動式購物、互動式辦公 互動式醫(yī)療、互動式教學、互動式游戲,互動式點播等應用為一身,代表了當今嵌入化多媒體終端的發(fā)展方向。
總而言之,計算機多媒體技術(shù)的應用和發(fā)展正處于高速發(fā)展的過程中,隨著各種觀念、技術(shù)的不斷發(fā)展和創(chuàng)新 并且融人多媒體技術(shù)中。未來將出現(xiàn)豐富多彩的、耳目一新的多媒體現(xiàn)象,它注定耍改變?nèi)祟惖纳罘绞胶陀^念。多媒體技術(shù)在模式識別、全息圖像、自然語言理解(語音識別與合成)和新的傳感技術(shù)等基礎(chǔ)上,利用人的語音、書寫、表情、姿勢、視線、動作和嗅覺等多種感覺通道和動作通道,通過數(shù)據(jù)傳輸和特殊的表達方式與計算機系統(tǒng)進行交互在未來有著最為廣闊的具應用前景。