不出所料,NVIDIA RTX 40系顯卡在GTC開發(fā)者大會與我們見面。整場大會由23點開始,持續(xù)至次日0點30分左右,不過在長達1小時30分的會議期間,GeForce RTX顯卡的發(fā)布僅占用了20分鐘的時間。
我們可以理解為重磅產品要簡單明了的公布出來,不過顯而易見,老黃意在NVIDIA的“AI元宇宙帝國”。
還是RTX 30系顯卡發(fā)布會熟悉的“i am AI”,只不過這次NVIDIA賦予了AI更多的身份。
更多關于醫(yī)療、自動駕駛、數(shù)字孿生、深度學習的內容,我們不在本文過多探討,著重看看本次發(fā)布的兩款重磅產品——GeForce RTX 4090和GeForce RTX 4080。
01 GeForce RTX 40系顯卡簡介
雖然RTX 40系顯卡只有短短的20分鐘時間,但能講的依然不少。本次發(fā)布會共發(fā)布了2款3張顯卡,2款分別為GeForce RTX 4090/GeForce RTX 4080,而3張則是因為GeForce RTX 4080分為16GB和12GB兩個版本。
從目前發(fā)布會公布的一些參數(shù)來看,GeForce RTX 4090依然是怪獸級別的性能,并且在CUDA數(shù)量懸殊如此大的情況下,即便是NVIDIA對于它的游戲性能也是侃侃而談。
而從賬面數(shù)據(jù)來看,GeForce RTX 4080的CUDA數(shù)量只有4090的60%左右,并且在顯存位寬上相較GeForce RTX 3080 10GB的320 bit也有所下降,功耗卻依然維持在了320W。
另外GeForce RTX 4080 12GB的顯存位寬僅有192 bit,這些數(shù)據(jù)看起來讓這張卡有點不像“80”級別的產品,不過畢竟兩代產品所使用的架構不同,我們也不好在這里胡亂猜測,一切都要等實際測試結果出來。
除了參數(shù)方面,在外觀上,F(xiàn)E版的RTX 40系顯卡并沒有太多的變化,我們僅能從圖中看出顯卡的側面均采用了內凹的傾角設計,而且細看的話,其中“4090”的數(shù)字字體,相較之前也有所不同。但實際還是以我們拿到手的實拍圖為準。
整體來看,此次發(fā)布的2款產品,基本屬于“超時代”的產物,不說GeForce RTX 4090這樣的怪獸。即便是目前GeForce RTX 3060在高清分辨率下玩3A游戲也是不虛的,況且目前還有那么多玩家手持GTX 1060這樣的性價比之王。
所以對于即將上市的RTX 40系顯卡,則更適合那些純純的發(fā)燒友,RTX 30系將依舊是主流玩家之選。
RTX 4090將于10月12日上市,建議零售價12999元起。
兩種配置版本的RTX 4080將于11月上市,建議零售價分別為9499元起和7199元起。
02 NVIDIA Ada Lovelace架構淺析
本次發(fā)布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,采用TSMC 4N定制工藝,達到了恐怖的760億個晶體管,而在RTX 30系顯卡中為280億個。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可達到90-TFLOPS的著色器數(shù)據(jù)吞吐量,而本次發(fā)布的GeForce RTX 4090則達到83-TFLOPs,相比上一代NVIDIA Ampere則只有40-TFOPs。
第三代RT Cores
RT Core的作用在于更快的光線追蹤計算能力,如果說在RTX 30系顯卡中,想要暢享4K高幀率游戲有點吃力,那么RTX 40系顯卡中,將顯得輕而易舉。
在GeForce RTX 4090這張顯卡上,達到了191 RT-TFLOPs的處理能力,而RTX 30系顯卡最快處理能力為78 RT-TFLOPs,足足為2.4倍。并且根據(jù)NVIDIA的官方說法,第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍。而這只能說明,這張4090并非Ada Lovelace架構的最終形態(tài)。
第四代Tensor Cores
除了光追單元的升級外,第四代張量核心的升級更加恐怖。它采用了新的FP8張量引擎,在GeForce RTX 4090這張顯卡上,吞吐量達到了1.32 Tensor petaFLOPs,提高了5倍。
注意這里的單位——petaFLOPs。
以往的TFOPs為萬億次浮點運算,而petaFLOPs則為千萬億次浮點運算。
03 DLSS 3 —— 神經(jīng)網(wǎng)絡渲染新時代
比較值得注意的是,在此次發(fā)布會上,DLSS被著重強調了一番。并且從目前來看,只有Ada Lovelace才引入了DLSS 3。
與此前不同的是,DLSS 3添加了AI驅動,在它的幫助下可以生成全新的高質量幀,而不僅僅是像素。
全新的DLSS 3結合了DLSS超分辨率、DLSS幀生成和NVIDIA Reflex這三大技術,能夠重建八分之七的像素,極大提高性能。如果DLSS 2能夠將幀率提高2倍,那么DLSS 3則能夠提升4倍。
并且在10月份我們就能見到第一批支持DLSS 3的游戲,根據(jù)NVIDIA的官方說法,DLSS 3首發(fā)即支持超過35款游戲及應用程序,不過目前尚不知道RTX 40系以前的顯卡是怎樣獲得提升的,這一點我們也會在后續(xù)的評測中進行實測。
04 播片環(huán)節(jié)
當然除此之外,在發(fā)布會上還公布了Ada Lovelace架構的一些其他創(chuàng)新和提升,在本篇回顧文章中就不多做剖析了。
誰家發(fā)布會也免不了播片環(huán)節(jié),更何況是以圖形計算見長的NVIDIA,下面我們就來欣賞幾張讓人難辨真假的圖片。
最后一個彩蛋,本次GTC大會,黃仁勛全程在黑底背景下講解。那么大家猜猜,本次發(fā)布會上的“老黃”,到底是真是假呢?
(8022228)