国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
NVIDIA正式公布Turing架構(gòu):自2006年以來圖形界最偉大的跨越

雖然NVIDIA正式公布新一代的GeForce游戲卡應(yīng)該要等到下周科隆游戲展前的“GeForce Gaming Celebration”活動,但是在昨天正式開幕的SIGGRAPH 2018,這場圖形界頂級大會上,NVIDIA是不可能空手到來的,而事實(shí)上他們昨晚確實(shí)有很多重量級的公布,包括全新的Turing架構(gòu)(注意,官博現(xiàn)在還沒有使用任何中文命名),包括第一張專用于光線追蹤的GPU:Quadro RTX,但是我們還是應(yīng)該從它的根基:新的Turing架構(gòu)開始說起。

NVIDIA的官方直播大概是早上的8:45結(jié)束的,現(xiàn)在還有很多細(xì)節(jié)沒有公布出來,所以我們先來看看官方的Newsroom,首先關(guān)于Turing架構(gòu),NVIDIA對其非常有自信,稱其為自從2006年通過統(tǒng)一渲染架構(gòu)帶來CUDA后最偉大的飛躍,所以你可想而知NVIDIA對其的期望,或者說野心。新的Turing架構(gòu)很重要的一點(diǎn)就是混合渲染(Hybrid Rendering)來實(shí)現(xiàn)光線追蹤,具體來說包括引入全新的RT Core來加速光線追蹤,還有我們已經(jīng)在Volta架構(gòu)看到的Tensor Core來加速AI處理,當(dāng)然還有光柵化,畢竟現(xiàn)在我們還沒有厲害到能夠拋棄光柵化的程度,所以新的Turing架構(gòu)是包含多種力量的,而這種包含多方力量來實(shí)現(xiàn)光線追蹤的混合渲染,應(yīng)該會成為日后的關(guān)鍵詞。

每次有新架構(gòu)到來,我們最關(guān)心的就是微架構(gòu)級別的變化:有哪些新增的特性,有哪些精簡的部分,如果說Volta架構(gòu)我們開始看到Tensor Unit,那么新的Turing架構(gòu)當(dāng)中最重要的就是新引入的RT Core。既然是“RT”,顧名思義就是沖著光線追蹤(Ray Tracing)來的,它的作用是用來加速處理光線在三維環(huán)境中的傳播,處理光線的速度是目前Pascal架構(gòu)的25倍,同時讓GPU作為節(jié)點(diǎn)處理最末幀(Final Frame)的效果渲染要比將CPU作為節(jié)點(diǎn)的速度快30倍。

同時讓人興奮的是,自從Volta架構(gòu)開始引入的Tensor Core,我們都知道它能提供遠(yuǎn)遠(yuǎn)高于傳統(tǒng)GPU的人工智能、深度學(xué)習(xí)性能,這部分性能能夠賦予我們的GPU去做很多以往沒有的工作,比如說在Turing架構(gòu)當(dāng)中的Tensor Core,能夠在每秒處理500萬億的張量運(yùn)算,通過這部分性能,我們能實(shí)現(xiàn)以往無法奢望的功能,比如說新的基于深度學(xué)習(xí)的抗鋸齒技術(shù):DLAA(Deep Learning Anti-Aliasing,萬物基于深度計算)。

最后在傳統(tǒng)的架構(gòu)方面,Turing在我們熟悉的SM單元當(dāng)中新增整數(shù)處理(Integer Unit)單元,以及新的統(tǒng)一緩存架構(gòu),能夠帶來目前架構(gòu)兩倍的帶寬。規(guī)格方面,Turing架構(gòu)能夠搭載最多4608 CUDA,并且能夠帶來最高16 TFlops浮點(diǎn)性能。當(dāng)然這是新發(fā)布的三款Quadro RTX顯卡當(dāng)中性能最強(qiáng)的RTX 8000而言的。

具體來說,昨晚NVIDIA共發(fā)布三款顯卡,分別是Quadro RTX 5000\6000\8000,最高端的RTX 8000跟次旗艦的RTX 6000兩張顯卡在流處理器數(shù)量、張量單元數(shù)量、光線追蹤性能方面都是一致的,分別是4608 CUDA、576 TC、10 GigaRays,只有顯存存在差異,RTX 6000是搭載24GB GDDR6顯存,通過NVLink橋接可以實(shí)現(xiàn)48GB顯存,按照現(xiàn)在16Gb的顯存來看,也是很夸張的,而RTX 8000的顯存直接翻倍?!叭腴T級”的RTX 5000則是3072 CUDA,384 TC(Tensor Cores)、6 GiagaRys,16GB GDDR6顯存。

在流處理器方面,如果是按照Volta V100的架構(gòu),那就是每組SM單元包含64 CUDA,即72組SM單元,但是72組SM單元怎么構(gòu)成GPC單元呢?過去的Volta V100是每組GPC單元包含14組SM單元,那這里就是除不盡的,難道NVIDIA還暗藏多余的SM單元?因?yàn)镚PC單元肯定是4組、6組、8組的組成,如果是按照6組,就應(yīng)該是6*14=84組SM單元,就算是按照128 CUDA/SM的構(gòu)成,要么每組GPC單元的構(gòu)成已經(jīng)精簡,要么目前的RTX 8000還不是完整架構(gòu)。

至少就卡本身的規(guī)格方面,目前AnandTech已經(jīng)拿到部分消息,他們已經(jīng)做成架構(gòu)之間的對比,就是RTX 8000分別對比GV 100、P6000、M6000,我們首先能看到在核心面積、晶體管數(shù)量、CUDA數(shù)量、紋理單元數(shù)量方面對比V100的規(guī)格是有精簡的(甚至核心面積都變?。?,頻率提高到1730MHz,顯存頻率14Gbps,位寬384-Bit,單精度16 TFlops,最后核心代號是尚不清楚的,GT102?現(xiàn)在誰知道呢。

圖片來源于AnandTech,詳情請咨詢這里

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
NVIDIA公開Volta顯卡秘密:完整版5376個核心,能效提升50﹪
12倍于上代的DP性能 NVIDIA Volta架構(gòu)解析(全文)
英偉達(dá)安培架構(gòu)淺析:GeForce RTX 3090是如何弄哭男生的?
超能課堂(182):從GTX到RTX,NVIDIA GPU架構(gòu)的變遷史
Tesla V100深度講解:專為深度學(xué)習(xí)設(shè)計的Tensor Core有多牛?|英偉達(dá)公開課實(shí)錄
巔峰對決:英偉達(dá) V100、A100/800、H100/800 GPU 對比
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服