国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
NVIDIA公開Volta顯卡秘密:完整版5376個核心,能效提升50%

AMD將在8月初發(fā)布RX Vega游戲顯卡,也將重返高性能顯卡市場,但是Vega這次面對的對手不只是16nm Pascal顯卡,還有NVIDIA新一代12nm FFN工藝的Volta顯卡。今年5月份NVIDIA率先發(fā)布了Tesla V100加速卡,用的是GV100大核心,游戲市場的Volta顯卡問世只是時間問題,它不會像Vega顯卡那樣難產(chǎn)。今天NVIDIA又公開了Volta核心的架構(gòu)秘密,確認了Volta完整版核心是84組SM單元,總計5376個CUDA核心,而且SM單元能效比Pascal這一代提升50%,而現(xiàn)在的GV100大核心只啟用了80組SM單元,5120個CUDA核心,NVIDIA還留有殺招。

NVIDIA上個月發(fā)布了Volta架構(gòu)首個產(chǎn)品Tesla V100

在5月份的GTC大會上,老黃在主題演講中已經(jīng)公布了不少Volta顯卡的細節(jié),發(fā)布會時間有限,不過可能全部講解Volta,現(xiàn)在NVIDIA又發(fā)布了Volta顯卡的架構(gòu)白皮書(鏈接點此),詳細介紹了Volta架構(gòu)的細節(jié),技術(shù)飯可以下載收藏。

NVIDIA確認Volta完整版擁有84組SM單元

我們之前在超能課堂(88):Volta顯卡架構(gòu)、性能解析,頻率紅利到頭了?一文中已經(jīng)介紹了Volta顯卡大部分技術(shù)內(nèi)容了,不愿意翻英文的玩家也可以看看這篇文章。簡單看了下這個白皮書,NVIDIA正式確認了完整版Volta顯卡是84組SM單元,每個SM單元有64組FP32浮點單元、64組INT32整數(shù)單元、32組FP64雙精度浮點單元、8個Tensor單元(用于深度學習、AI的張量處理器)、4個紋理單元,外加8組512bit顯存控制器,每個HBM 2堆棧搭配2組顯存控制器,總計有5376個CUDA核心(FP32、INT32)、2688個FP64單元、336個紋理單元、672個Tensor單元,還有4096bit等效位寬、16GB HBM 2顯存,帶寬900GB/s。

Tesla V100加速卡具體規(guī)格

NVIDIA的Volta顯卡使用了TSMC與NVIDIA定制的12nm FFN工藝,而TSMC的12nm工藝實際上也是基于目前16nm工藝改良的,主要優(yōu)化了能耗、核心面積,性能比16nm FFC工藝提升10%,但是核心面積可縮減20%。即便如此,GV100大核心的面積依然從目前的610mm2增加到了815mm2,主要原因就是SM單元數(shù)量大增,從60組SM單元增加到了84組。

根據(jù)NVIDIA的白皮書介紹,Volta架構(gòu)的SM單元做了大幅改進,新的SM單元能效比Pascal這代提升50%,因此才能在同樣的功耗封裝下大幅提升FP32/FP64計算性能。

Volta架構(gòu)的SM單元設(shè)計

當然,NVIDIA在Volta顯卡上的重點除了提升傳統(tǒng)的FP32/FP64計算性能之外,最重要的還是提升深度計算性能,為此增加了專用的計算單元,每組SM單元有8個Tensor單元,總計640個Tensor單元,Tensor性能可達120TFLOPS,是Pascal這代的12倍多。

不過現(xiàn)在的GV100大核心很有可能跟去年的GP100大核心一樣專用于計算市場,真正對游戲玩家有影響的還是后面的GV102核心,NVIDIA勢必要做些精簡,比如砍掉對游戲沒用的Tensor單元,減少L2緩存,HBM 2顯存也沒必要,SM單元很有可能也會重組,可以預(yù)見游戲用的GV102核心會進一步降低能耗,不過CUDA核心總數(shù)相比Pascal也會大幅提升,游戲性能再上一個臺階。

此前也有一些Volta顯卡在路上的傳聞,不過對NVIDIA來說出Volta顯卡沒什么阻礙,只是他們?nèi)绾芜x擇的問題,畢竟今年才發(fā)布了GTX 1080 Ti、Titan Xp以及GT 1030顯卡,布局已經(jīng)很完整了,Volta顯卡并無緊迫性,除非AMD的RX Vega顯卡表現(xiàn)驚人,NVIDIA需要新一代產(chǎn)品來壓制,這時候Volta顯卡發(fā)布上市進度才會加快,大家覺得今年有這個可能嗎?

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
12倍于上代的DP性能 NVIDIA Volta架構(gòu)解析(全文)
巔峰對決:英偉達 V100、A100/800、H100/800 GPU 對比
超能課堂(182):從GTX到RTX,NVIDIA GPU架構(gòu)的變遷史
一文詳解英偉達剛發(fā)布的 Tesla V100 究竟牛在哪?
30億美金投入!一文讀懂英偉達性能兇殘的Tesla V100牛在哪?【附下載】| 智東西內(nèi)參
GPU到底如何做到這么快的?
更多類似文章 >>
生活服務(wù)
分享 收藏 導長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服