国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
從MP3到高清電視的多媒體處理器架構(gòu)

目前,多媒體設(shè) 備的范圍非常廣泛:從兒童使用的價(jià)格不到20美元的MP3播放機(jī)到屏幕尺寸幾乎和電影院里差不多的家用平板顯示器。在先進(jìn)的電視機(jī)上顯示圖像意味著需要對 高清分辨率的H.264比特流進(jìn)行解碼,所需的處理器馬力要比解碼MP3文件所需馬力高3個(gè)數(shù)量級以上。這種處理能力不對等的另一個(gè)例子則是照相手機(jī)和攝 像機(jī)的比較。手機(jī)所拍的圖像視頻為QCIF (176x144)格式,而目前的攝像機(jī)的視頻格式則為HD MPEG-2。這些格式對設(shè)備的視頻子系統(tǒng)的處理能力的需求差別極大。對于SoC設(shè)計(jì)師來說,如果能夠保持處理器基礎(chǔ)架構(gòu)不變將是非常有益的。否則,如果 需要重新設(shè)計(jì)來滿足如此寬的應(yīng)用范圍中的每項(xiàng)設(shè)計(jì)應(yīng)用需求,必將導(dǎo)致更高的設(shè)計(jì)成本及更長的上市時(shí)間。

消費(fèi)者可能想在不同設(shè)備上播放和共享內(nèi)容。絕大多數(shù)人已經(jīng)擁有多套多媒體設(shè)備,如電視機(jī)、機(jī)頂盒、DVD機(jī)、手機(jī)、電腦、PMP等。未來 設(shè)備的一個(gè)重要能力就是能夠在這些設(shè)備之間傳輸和/或轉(zhuǎn)移內(nèi)容。在這些極其不同的設(shè)備之間需要具有互操作性。由于所用的音視頻編碼標(biāo)準(zhǔn)有很多,互操作性要 求基礎(chǔ)多媒體處理架構(gòu)具有可編程性。然后在軟件中編入編碼標(biāo)準(zhǔn),從而使得終端設(shè)備靈活并能實(shí)現(xiàn)升級。

可編程性同時(shí)也意味著可以對影響音頻和 圖像質(zhì)量的關(guān)鍵算法進(jìn)行升級——即通過升級使其具有所需的功能,這是因?yàn)楣こ處煵粩嗟匮邪l(fā)用來提高音頻和圖像質(zhì)量的新方法,事實(shí) 上也正是這些語音和圖像質(zhì)量使得其產(chǎn)品具備與競爭產(chǎn)品之間的差異化??删幊绦酝瑯右彩沟闷骷圃焐踢M(jìn)一步實(shí)現(xiàn)產(chǎn)品差異化,可以為用戶提供不同的SoC使用 方法,降低流片風(fēng)險(xiǎn),并延長產(chǎn)品的市場壽命。

結(jié)果,多媒體處理器架構(gòu)必須覆蓋很大范圍的復(fù)雜度并能夠軟件可編程。ARC Vraptor采用了特殊的多核方案:多個(gè)高性能處理器被連接到多個(gè)SIMD處理器和多個(gè)DMA引擎,還采用了面向不同域的加速器。所有這些都帶有低開銷,低延遲的通信信道和本地寬帶數(shù)據(jù)總線。


圖1:ARC VRaptor 多媒體處理器架構(gòu)

并行多媒體處理

對于可提供的實(shí)際時(shí)鐘頻率來說,當(dāng)需要比一個(gè)單處理器的能力還高的性能時(shí),并行處理是 加速的唯一方法。但是,Amdahl定律告訴我們,只有算法的一部分可以并行,而有些部分是不能并行的,因而最終的加速系數(shù),并非并行處理器的數(shù)量。極少 應(yīng)用可以容易地實(shí)現(xiàn)全并行,通過增加處理器就可以實(shí)現(xiàn)系統(tǒng)性能的線性加速。而現(xiàn)實(shí)中的多媒體應(yīng)用的并行處理可以涉及到全過程:并行得到的好處不但非微不足 道,而且肯定可以大大地增加效率并改善性能,如果并行處理得好的話。在為所運(yùn)行的應(yīng)用設(shè)計(jì)一個(gè)好的子系統(tǒng)之前,設(shè)計(jì)師應(yīng)該仔細(xì)地分析這些應(yīng)用的性質(zhì),看一 看如何將這些應(yīng)用分配到各個(gè)處理單元中。

視頻和圖像算法通常容易實(shí)現(xiàn)并行處理;一幅圖像的左上角的像素與一幅圖像的右下角的像素關(guān)聯(lián)很少,故可以獨(dú)立進(jìn)行處理,因此處理可以并 行。在一幅簡單圖像的獲取和顯示過程中,處理的情況是這樣的:從圖像獲取階段基本上都是并行處理,到視頻壓縮/解壓縮的信息墑編解碼階段變成完全串行處 理,然后再返回到顯示器上像素的全并行處理。顯然,需要一個(gè)既擅長串行處理又擅長并行處理的混合處理器架構(gòu)。

像MPEG-2這類視頻編碼標(biāo)準(zhǔn)處理的數(shù)據(jù)塊為8x8,而更新的一些標(biāo)準(zhǔn),像H.264和VC-1,則采用顆粒更細(xì)的4x4數(shù)據(jù)塊。另一個(gè) 例子是H.264的許多預(yù)測模式,這些模式利用某像素?cái)?shù)據(jù)與相鄰4x4數(shù)據(jù)塊之間的關(guān)聯(lián)性并引入相關(guān)性。靠近鏡頭和顯示器兩側(cè)的處理趨勢是追求更細(xì)的顆粒 度。自適應(yīng)算法被廣泛采用,算法中濾波器的選擇取決于周邊像素值,等于又一次引入相關(guān)性。

精細(xì)的粒度意味著通信事件之間需要的計(jì)算量較小,這使得有效的通信機(jī)制至關(guān)重要。ARC公司VRaptor架構(gòu)的SIMD引擎設(shè)計(jì)用于自動實(shí)現(xiàn)超細(xì)粒度,而VRaptor架構(gòu)的工作信道為處理引擎中的同步和通信提供一個(gè)有效的手段。

除并行之外,還有另外一個(gè)軸,沿著這個(gè)軸能夠使操作得到優(yōu)化和加速。除了將應(yīng)用分配到一系列處理引擎上,與此同時(shí)還可以將每個(gè)處理或數(shù)據(jù)轉(zhuǎn) 移單元配置到最適用于并行任務(wù)。VRaptor架構(gòu)沒有采用通常的方案,即一個(gè)處理器可以適用于所有任務(wù)的方案。而是采用了與通常不一樣的方案:其處理架 構(gòu)由一組處理引擎和數(shù)據(jù)轉(zhuǎn)移引擎組成,每個(gè)都只適用于特定的任務(wù),故對其進(jìn)行配置使其完成所適合的任務(wù)。這些引擎在一個(gè)數(shù)據(jù)流水線中一起工作。下面將繼續(xù) 描述VRaptor架構(gòu)中每個(gè)處理引擎的具體功能,但要首先快速地看一下位于配置核心的配置工具——ARChitect。

ARChitect處理器配置

使用ARChitect時(shí),設(shè)計(jì)師可以通過ARChitect工具的拖放式GUI來加入應(yīng)用中所需要的功能,并去掉應(yīng)用中不需要的功能。在 ARChitect中有20000多個(gè)處理器內(nèi)核配置選項(xiàng),包括內(nèi)核周邊的功能選項(xiàng),例如高速緩存的類型和容量、緊耦合的存儲器、存儲器管理單元、中斷、 DSP子系統(tǒng)、計(jì)時(shí)器和調(diào)試部件等;也包括核內(nèi)部的功能選項(xiàng),例如寄存器的類型和容量、地址寬度、系統(tǒng)接口、指令集選擇和客戶定制擴(kuò)展。性能和芯片尺寸之 間的折衷很容易實(shí)現(xiàn),從而導(dǎo)致一個(gè)最佳方案。最終的結(jié)果是比固定架構(gòu)的內(nèi)核體積更小,功耗更低。在ARChitect中,設(shè)計(jì)師也可以為系統(tǒng)設(shè)計(jì)來選擇、 增加和配置所需的軟件編解碼,硬線加速器,以及DMA引擎。

在部件被選定并配置好后,輕輕一點(diǎn)就可以產(chǎn)生RTL,軟件工具(仿真器,編譯器,代碼連接器等)以及EDA工具腳本。ARChitect一開始被設(shè)計(jì)用來配置ARC自己的IP,不過現(xiàn)在也被其他半導(dǎo)體生產(chǎn)商用來配置他們的IP。


圖2:ARChitect 系統(tǒng)配置工具。

可配置的RISC處理器

ARChitect架構(gòu)基于ARC700可配置處理器核系列。這些核比較節(jié)省硅片,性能好,并能定制和擴(kuò)展以適合所需的特定應(yīng)用。 ARChitect架構(gòu)有很多等級,從一個(gè)單ARC710D CPU到多個(gè)可配置的ARC750D CPU,每個(gè)CPU都帶有多個(gè)多媒體處理器,多個(gè)加速器和多個(gè)I/O設(shè)備。

最小的配置小于0.5mm2,采用90nm工藝,存儲器除外。每個(gè)處理器從一個(gè)ARC750 CPU架構(gòu)的基本配置上擴(kuò)展,確保與ARCompact ISA的指令級兼容性,并允許采用與支持其它ARC子系統(tǒng)和處理器相同的工具集,包括MetaWare,,Green Hills和GNU工具,所有這些工具都提供廣泛的建模(profiling),調(diào)試和匯編支持。通過平衡往ARC700 CPU增加客戶指令擴(kuò)展的能力,ARC客戶可以利用其深入的應(yīng)用經(jīng)驗(yàn)對VRaptor架構(gòu)的部件進(jìn)一步優(yōu)化,并進(jìn)一步實(shí)現(xiàn)其產(chǎn)品的差異化。

SIMD引擎

與ARC視頻子系統(tǒng)類似,VRaptor架構(gòu)利用一個(gè)單指令、工作在128位數(shù)據(jù)向量上的多路數(shù)據(jù)(SIMD)多媒體處理器來擴(kuò)展 ARC700 CPU系列。操作數(shù)來自一個(gè)專用的向量寄存器文件,可以組織成4個(gè)32位單元,8個(gè)16位單元或16個(gè)8位單元。SIMD處理器通常采用與ARC700 CPU相同的時(shí)鐘頻率,并具有兩種工作方式:一個(gè)是只簡單地?cái)U(kuò)展ARC700 CPU系列流水線的緊耦合方式;另一個(gè)是松耦合方式。在松耦合方式中,SIMD處理器與ARC700 CPU架構(gòu)并行,并高效率地獨(dú)立工作。

SIMD處理器利用跳轉(zhuǎn)和分支指令實(shí)現(xiàn)了全控制能力。精細(xì)的并行決策機(jī)制利用預(yù)測執(zhí)行提升了代碼性能。利用一個(gè)進(jìn)取型的正向數(shù)據(jù)網(wǎng)絡(luò)提升 了流水線效率,從而減少了關(guān)鍵路徑和運(yùn)算。SIMD指令集全正交,并具有從各個(gè)用于所有指令和額外的轉(zhuǎn)移指令的標(biāo)量寄存器廣播數(shù)據(jù)的能力。先進(jìn)的多媒體處 理器功能允許ARC VRaptor架構(gòu)的SIMD引擎通過從ARC700系列的CPU上卸載低級控制代碼來釋放ARC700系列處理器,使之用于系統(tǒng)管理和數(shù)據(jù)流管理。 VRaptor架構(gòu)允許用一個(gè)ARC700系列的控制處理器來控制多個(gè)多媒體處理器。

多媒體DMA處理器

VRaptor架構(gòu)采用了一個(gè)多媒體增強(qiáng)型2D DMA控制器轉(zhuǎn)移數(shù)據(jù)出入系統(tǒng)。它們獨(dú)立地轉(zhuǎn)移數(shù)據(jù),從而釋放了處理器,使得處理器能夠?qū)W⒂谟?jì)算任務(wù)。ARC以視頻為中心的DMA被優(yōu)化來轉(zhuǎn)移視頻編碼 應(yīng)用中常見的2D數(shù)據(jù)塊。緊耦合的2D DMA引擎轉(zhuǎn)移以非常高效率的方式設(shè)置和運(yùn)行,通常只需一個(gè)單指令。由于視頻數(shù)據(jù)轉(zhuǎn)移以較小的突發(fā)數(shù)據(jù)串進(jìn)行,這對降低開銷來說非常重要。例如, H.264標(biāo)準(zhǔn)要求抓取許多4x4像素?cái)?shù)據(jù)塊,因?yàn)橐催@個(gè)粒度進(jìn)行運(yùn)動補(bǔ)償。多媒體DMA有許多通道以便允許參考幀輸入數(shù)據(jù)塊和被解碼的像素?cái)?shù)據(jù)塊能并 行設(shè)置和操作。處理器引擎也可以通過共享的寬帶存儲器來直接共享數(shù)據(jù)。DMA處理器被特別設(shè)計(jì)用于處理器和系統(tǒng)存儲器之間的數(shù)據(jù)轉(zhuǎn)移。

特定域擴(kuò)展

VRaptor架構(gòu)可以利用特定域加速器進(jìn)行無縫擴(kuò)展。典型地,這些擴(kuò)展能夠?qū)崿F(xiàn)大數(shù)據(jù)塊處理,以便在ARC700 CPU或SIMD處理器上運(yùn)行,不過若以一個(gè)固定的硬件模塊來實(shí)現(xiàn)這些處理塊效率要高得多。VRaptor 架構(gòu)包括多標(biāo)準(zhǔn)可變長度的解碼器和編碼器。由于數(shù)據(jù)的相關(guān)性,這些信息代碼塊不能并行,又由于大量的查找信息在一個(gè)小表里,所以符號的編碼和解碼按硬連接 擴(kuò)展的方式來實(shí)現(xiàn)將效率更高,不過為了滿足多視頻編碼標(biāo)準(zhǔn),編碼和解碼應(yīng)保持足夠的靈活性。

運(yùn)動估計(jì)是另外一個(gè)領(lǐng)域,這里,絕對差運(yùn)算的重復(fù)簡單求和需要大量的數(shù)據(jù)重組和轉(zhuǎn)移,并執(zhí)行大量的數(shù)據(jù)。盡管在一個(gè)VRaptor架構(gòu) SIMD引擎上能夠高效率地實(shí)現(xiàn)這類的運(yùn)動補(bǔ)償算法,但仔細(xì)的設(shè)計(jì)探索和折衷證明了按硬連接擴(kuò)展的方式來實(shí)現(xiàn)視頻編碼的運(yùn)動估計(jì)具有明顯的優(yōu)勢。在探索硬 連接擴(kuò)展的設(shè)計(jì)空間與全部可編程塊的比較時(shí),ARChitect自動地配置軟件和編譯工具,使得他們與所選的系統(tǒng)架構(gòu)相匹配。這就使得系統(tǒng)設(shè)計(jì)師能夠在不 需要調(diào)整或改變手頭上軟件的條件下快速地對性能和實(shí)現(xiàn)結(jié)果進(jìn)行測試。

工作通信信道

32位工作通信信道是處理引擎通信的工具。工作通信信道開銷低,處理器間的通信延遲小,這些對于實(shí)現(xiàn)需要精細(xì)粒度通信的視頻和音頻應(yīng)用來說 都是至關(guān)重要的。處理器引擎之間的共享數(shù)據(jù)存儲器允許進(jìn)行本地的、高速的、以及寬帶數(shù)據(jù)通信。正在申請專利的ARChitect多媒體架構(gòu)中的工作通信信 道技術(shù)是一套基于遠(yuǎn)程調(diào)用的工作信道協(xié)議。它提供多個(gè)VRaptor核、VRaptor加速器以及VRaptor I/O單元之間的點(diǎn)對點(diǎn)硬件鏈路、承載命令以及變元(arguments)。對于增強(qiáng)性能,信道被緩沖而輸入進(jìn)行排隊(duì)。因此發(fā)送器和接收器在發(fā)送和接收信 息時(shí)不需要“及時(shí)集中數(shù)據(jù)(rendezvous in time)”。工作通信信道能夠使發(fā)送器明白無誤地更新接收器中的寄存器。依賴于發(fā)送器能夠直接寫函數(shù)變量寄存器,然后再寫送往程序計(jì)數(shù)器的 遠(yuǎn)程函數(shù)入口點(diǎn),這就允許非常高效的遠(yuǎn)程方法調(diào)用(即一個(gè)遠(yuǎn)程過程調(diào)用)。從接收器來看,該操作所用的時(shí)鐘周期與本地調(diào)用一樣多,故效率是非常高的。


圖3:VRaptor 處理架構(gòu)中的工作通信信道。

工作通信信道技術(shù)受到ARC可配置ISA中的指令擴(kuò)展的直接支持,從而省去了信息解釋開銷。它提供一個(gè)統(tǒng)一的編程模型,從而精簡了通常與多處理器架構(gòu)相關(guān)的編程開銷。

基于VRaptor架構(gòu)的系統(tǒng)

目前有兩個(gè)多媒體子系統(tǒng),每個(gè)都包括絕大部分的VRaptor功能。ARC視頻子系統(tǒng)是一個(gè)用于標(biāo)清分辨率的多標(biāo)準(zhǔn)視頻解碼解決方案。它包 括一個(gè)ARC700類處理器,一個(gè)為視頻編碼應(yīng)用優(yōu)化的SIMD處理器,一個(gè)2D DMA控制器,外加一個(gè)信息解碼加速器。ARC語音先進(jìn)子系統(tǒng)瞄準(zhǔn)的是高保真的語音產(chǎn)品,例如汽車娛樂系統(tǒng)和高清光盤播放機(jī)。其配置與ARC視頻子系統(tǒng)相 類似:一個(gè)ARC700類處理器,一個(gè)為語音編碼應(yīng)用優(yōu)化的SIMD處理器和一個(gè)DMA引擎。基于VRaptor其它子系統(tǒng)很快就會發(fā)布。

本文小結(jié)

ARC VRaptor多媒體架構(gòu)正在用ARC的新一代多媒體子系統(tǒng)來實(shí)現(xiàn)。能夠全部利用所有架構(gòu)功能的初期產(chǎn)品已在今年初向全球的SoC設(shè)計(jì)師提供?;?VRaptor架構(gòu)的系統(tǒng)具有可升級性,低功耗,節(jié)省大眾市場產(chǎn)品所需硅片面積,同時(shí)保持了可編程性。具有工作通信信道的VRaptor的特殊混合方案, 為ARC公司解決未來的從高保真到高清領(lǐng)域的音頻、視頻和圖形應(yīng)用打下了堅(jiān)實(shí)的基礎(chǔ)。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
基于CELL Broadband Engine開發(fā)高性能應(yīng)用
ARC VPX處理器:為以數(shù)據(jù)為中心的世界而設(shè)計(jì)的下一代DSP架構(gòu)
CPU指令集的誕生、發(fā)展、分類及對處理器性能提升的作用
CPU術(shù)語集全--腦力激蕩
拿起SIMD的武器I
CPU官方興奮劑!歷代Intel指令集回顧
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服