英特爾數(shù)據(jù)中心GPU最新披露:面向云游戲、流媒體,今年Q3上市
量子位2022-05-12 20:10北京鯤鵬計劃獲獎作者,北京極客伙伴科技有限公司,優(yōu)質(zhì)科技領(lǐng)域創(chuàng)作者
關(guān)注
英特爾至強可擴展處理器是面向云游戲、多媒體處理與傳輸、虛擬桌面基礎(chǔ)架構(gòu)和推理運算的處理器標(biāo)桿,致力于為當(dāng)今的媒介消費提供鼎力支持。
隨著當(dāng)前工作負載密度和復(fù)雜程度的快速增長,以上每個細分領(lǐng)域都將提出不同的工作負載需求,包括從處理像素、推理和分析、到渲染新的畫面內(nèi)容,再到將這些像素輸出至客戶端設(shè)備進行查看或進一步分析。
然而,目前這些工作都是通過在云端的各個獨立產(chǎn)品來完成的。
在本屆英特爾 On 產(chǎn)業(yè)創(chuàng)新峰會(Intel Vision)上,英特爾分享了其代號為 Arctic Sound-M(ATS-M)的數(shù)據(jù)中心 GPU 的更多細節(jié)。
ATS-M 是一顆支持高質(zhì)量轉(zhuǎn)碼和高性能的強大 GPU,能夠提供每秒 150 萬億次運算(150 TOPS),共擁有兩種配置。
ATS-M 能夠通過單一解決方案靈活地處理廣泛的工作負載,并在不犧牲性能或者質(zhì)量的同時,優(yōu)化總體擁有成本(TCO)。
面向數(shù)據(jù)中心工作負載的多用途 GPU
該英特爾數(shù)據(jù)中心 GPU 將包含兩種不同的配置:
150W 功率版本在一個3/4長、全高尺寸的 PCIe 4.0 加速卡中封裝了 32 個 Xe 內(nèi)核。
75W 功率版本則在半高尺寸的 PCIe 4.0 加速卡中封裝了兩顆具有 8 個 Xe 內(nèi)核的 GPU,共 16 個 Xe 內(nèi)核。
這兩種配置均配備了 4 個 Xe 媒體引擎、英特爾首款面向數(shù)據(jù)中心的 AV1 硬件編碼器和加速器、GDDR6 內(nèi)存、光線追蹤單元和內(nèi)置 XMX AI 加速。
采用開源軟件的行業(yè)領(lǐng)先數(shù)據(jù)中心 GPU
該英特爾數(shù)據(jù)中心 GPU 由完整的解決方案堆棧支持,為開發(fā)者提供了面向流媒體、云游戲和云端推理的開源軟件堆棧,并廣泛支持 AVC、HEVC、VP9,以及更多 API、框架和最新的編解碼器。
oneAPI 為加速計算提供了高效、智能的路徑,讓開發(fā)者免受專有編程模型所帶來的經(jīng)濟和技術(shù)負擔(dān)。
它為專用硬件的封閉編程語言供了開放的選擇,即通過一套完整、可靠的工具包來完善現(xiàn)有編程語言和并行計算模型,從而釋放硬件的全部性能,并且能夠讓開發(fā)者設(shè)計出開放、可移植的代碼,更大限度地利用多種 CPU 和 GPU 的組合。
云游戲
全球云游戲市場呈現(xiàn)持續(xù)快速增長趨勢,預(yù)計到2026年,其復(fù)合年增長率(CAGR)將達到 43.2%,市值將近 32 億美元。
英特爾可為 Windows 和 Android 云游戲平臺提供支持,為廣大玩家?guī)砀咂焚|(zhì)的游戲體驗。ATS-M 擁有兩種不同的產(chǎn)品外形設(shè)計,用戶可靈活地選擇符合他們特定工作負載的產(chǎn)品配置。
無論用戶對峰值性能、高密度提出需求,還是期待通過一個平臺滿足跨智能手機和 PC 游戲的融合云游戲解決方案,這款 GPU 均可以提供出色的游戲串流體驗。
全堆棧媒體流支持
該 GPU 配備了英特爾首款基于硬件加速的 AV1 編碼器,可在不犧牲質(zhì)量的同時,帶來 30% 比特率的提升。
作為引領(lǐng)新一代媒體串流的 GPU,它可實現(xiàn)一卡同時處理多達 8 路 4K 視頻流或超過30 路 1080p 視頻流。在一臺 4 卡服務(wù)器中,可以實現(xiàn)每節(jié)點處理 120 路視頻流以及每機架處理 13,000 路視頻流。
利用 Intel oneVPL,媒體串流和傳輸軟件堆棧可以面向包括 AV1 在內(nèi)的所有主流編解碼器進行解碼和編碼加速。
流媒體發(fā)行商可以在 FFmpeg 或 GStreamer 這兩大領(lǐng)先多媒體處理框架中進行選擇,它們均可通過 oneVPL 針對英特爾 CPU 和 GPU 進行加速。
英特爾還提供了開放視覺云(Open Visual Cloud),這是一套用于媒體、分析、圖形和沉浸式媒體的開源軟件堆棧,它針對云原生部署進行了優(yōu)化,使其能夠在 FFmpeg 和 GStreamer 框架內(nèi)運行。
全堆棧虛擬桌面基礎(chǔ)架構(gòu)支持(VDI)
過去兩年,隨著遠程辦公需求的增加,虛擬桌面基礎(chǔ)架構(gòu)(VDI)和設(shè)備即服務(wù)(DaaS)迎來了快速增長(最近一項研究表明增長超過 11%)。
現(xiàn)代操作系統(tǒng)和應(yīng)用程序?qū)D形處理的要求越來越高,顯示器的分辨率也隨之提高;GPU 可以通過承載渲染和編碼功能,以更短的響應(yīng)時間和更高的幀率來改善用戶體驗。
由此釋放出來的 CPU 處理能力可以帶來應(yīng)用程序工作負載的性能提升。
英特爾的這款數(shù)據(jù)中心 GPU 還提供了靈活的虛擬 GPU(vGPU)調(diào)度策略(固定的、靈活的以及硬件利用率優(yōu)化過的時間片任務(wù)調(diào)度器),讓管理員能夠單獨微調(diào) GPU 上每個虛擬機的運行指令。
目前,其他廠商的產(chǎn)品僅允許在所有虛擬機的全局設(shè)置中進行相關(guān)調(diào)整。
與目前市面上其他產(chǎn)品不同的是,英特爾不會針對基于硬件的可擴展 I/O 虛擬化(SIOV)額外收取任何軟件授權(quán)費,這將有助于相關(guān)提供商降低虛擬化部署的總成本。
全堆棧媒體分析支持
每個在視覺媒體場景執(zhí)行的推理都需先經(jīng)過視頻解碼和預(yù)處理,然后才能交給 AI 模型進行下一步操作。
集成兩顆 GPU 的 75W 功率版本 ATS-M 能夠在計算和解碼能力上實現(xiàn)很好的平衡,且不受媒體限制。
因此,它能夠針對媒體分析類的工作負載提供良好的擴展性,為客戶提供更高的流密度和更低的成本。
在使用 oneVPL 對于視頻流的解碼和編碼進行加速的同時,oneDNN(oneAPI 深度神經(jīng)網(wǎng)絡(luò)庫)可針對內(nèi)核進行 AI 優(yōu)化,加速面向 TensorFlow 或 PyTorch 框架的推理模型;也可通過 OpenVINO 的模型優(yōu)化器和推理引擎,進一步加速推理以及客戶工作負載的部署。
上述 AI 和媒體軟件以及堆棧的組合可以在至強處理器和英特爾數(shù)據(jù)中心 GPU 之間無縫運行。
代號為 Arctic Sound-M 的英特爾數(shù)據(jù)中心 GPU 已經(jīng)獲得超過 15 款來自業(yè)界領(lǐng)先合作伙伴的設(shè)計,并將于 2022 年第三季度發(fā)布。
注意事項與免責(zé)聲明:實際性能受使用情況、配置和其他因素的差異影。更多信息請訪問:www.Intel.com/PerformanceIndex。性能結(jié)果基于配置信息中顯示的日期進行測試,且可能并未反映所有公開可用的更新。配置詳情見備用信息。沒有任何產(chǎn)品或組件能夠保證絕對安全。您的成本和結(jié)果可能有所不同。