隨著NVIDIA RTX 40系列、AMD RX 7000系列的陸續(xù)登場(chǎng),新一輪顯卡大戰(zhàn)漸入高潮。那么,“后發(fā)制人”的AMD RX 7900系列有什么特異之處呢?
近日,被業(yè)界譽(yù)為“RDNA架構(gòu)技術(shù)傳奇的”AMD Radeon技術(shù)事業(yè)部工程研發(fā)高級(jí)副總裁王啟尚(David Wang)先生,接受了快科技的專(zhuān)訪(fǎng),暢聊了多個(gè)有關(guān)AMD RX 7900系列顯卡的前沿技術(shù)話(huà)題。
王啟尚在美國(guó)華盛頓大學(xué)獲得電子工程碩士學(xué)位,曾先后就職于LSI Logic、Axil、SGI、ArtX等半導(dǎo)體芯片企業(yè),2000年加入ATI,2006年隨著ATI被收購(gòu)而進(jìn)入AMD。
王啟尚具備極其豐富的圖形芯片設(shè)計(jì)、開(kāi)發(fā)與管理經(jīng)驗(yàn),在A(yíng)MD(ATI)眾多GPU產(chǎn)品的研發(fā)中起到了不可替代的領(lǐng)導(dǎo)作用,尤其是RDNA系列GPU架構(gòu),以超高能效而聞名。
——HYPR-RX:一鍵開(kāi)啟大禮包
AMD Adrenalin驅(qū)動(dòng)軟件中提供了豐富、強(qiáng)大的功能,但事實(shí)上,很多游戲玩家拿到卡之后直接就開(kāi)始玩了,很少會(huì)去仔細(xì)研究一些特別的功能會(huì)帶來(lái)什么樣的好處,造成浪費(fèi),也不利于發(fā)揮顯卡的全部實(shí)力和潛力。
為此,AMD開(kāi)發(fā)了HYPR-RX,將Adrenalin驅(qū)動(dòng)內(nèi)的多個(gè)功能與技術(shù)整合在一起,包括Radeon Boost性能加速、Radeon Anti-Lag抗延遲、RSR超分辨率等,可以一鍵開(kāi)啟。
這樣,它們就能協(xié)同,由此能夠降低延遲也能提供相比原來(lái)設(shè)置最高達(dá)85%的更強(qiáng)性能。
該功能預(yù)計(jì)2023年上半年正式上線(xiàn),目前僅支持RX 7000系列顯卡,暫時(shí)不會(huì)支持RX 6000系列或更老的型號(hào)。
——FSR:從超分辨率到補(bǔ)幀
截止10月底,AMD FSR超分辨率技術(shù)已經(jīng)獲得超過(guò)216款游戲的支持,其中85款已支持FSR 2。
FRS技術(shù)的下一個(gè)版本是FSR 2.2,重點(diǎn)進(jìn)一步改善了畫(huà)質(zhì),比如減少快速移動(dòng)物體的重影。
它和FSR 2.1/2.0同樣基于時(shí)域放大算法,不需要依靠AI或者專(zhuān)用的AI硬件,就可以實(shí)現(xiàn)出色的畫(huà)質(zhì)和性能。
據(jù)介紹,AMD和3DMark所屬公司UL Solutions也有很好的合作。目前,3DMark有針對(duì)NVIDIA DLSS和Intel XeSS的功能進(jìn)行測(cè)試,正在擴(kuò)展功能測(cè)試項(xiàng)目,其中就會(huì)包括一項(xiàng)專(zhuān)門(mén)針對(duì)AMD FSR的測(cè)試,它將使用FSR 2.2幫助用戶(hù)在他們的硬件上進(jìn)行FSR的性能和圖像質(zhì)量的對(duì)比。
王啟尚透露,在縮放技術(shù)上,AMD的下一個(gè)重大版本將是FSR 3,支持AMD Fluid Motion Frame補(bǔ)幀技術(shù),預(yù)計(jì)可帶來(lái)比FRS 2最多2倍的幀率,技術(shù)上會(huì)有很大的優(yōu)勢(shì)。
FSR 3技術(shù)預(yù)計(jì)將在2023年推出,更多細(xì)節(jié)會(huì)在后續(xù)出。
從目前的情況看,筆者認(rèn)為AMD FSR 3不再是傳統(tǒng)的超分辨率縮放技術(shù),而是全新的幀生成技術(shù),通過(guò)AI計(jì)算、匹配直接在渲染幀之間插入新的幀,從而大幅提升幀率,并保持同樣甚至更好的畫(huà)質(zhì)。
這樣一來(lái),F(xiàn)SR 3同樣也不會(huì)取代 FRS 2.x,而是并行發(fā)展,游戲也可以同時(shí)支持,讓玩家根據(jù)自己的需求和喜好來(lái)使用。
——多媒體:支持AV1、賽靈思AI助陣
多媒體一直是AMD GPU的強(qiáng)項(xiàng),視頻編解碼、媒體串流等方面每一代都有創(chuàng)新技術(shù)和應(yīng)用。
RDNA3架構(gòu)集成了全新的媒體引擎,支持AV1視頻編解碼,其內(nèi)部的頻率也增加了1.8倍,所以基本上能夠?qū)⒁恍┚幋a和解碼的時(shí)間相比上代節(jié)省一半。
AMD還在其中集成了賽靈思開(kāi)發(fā)出的內(nèi)容自適應(yīng)機(jī)器學(xué)習(xí)技術(shù),能夠提升文本內(nèi)容在編碼解碼時(shí)的質(zhì)量,目前只適用Windows 11上的DX應(yīng)用程序,且目前它的分辨率只支持1080p分辨率及以下。不過(guò)王啟尚表示,未來(lái)將繼續(xù)加強(qiáng)該技術(shù)并擴(kuò)展至比較高的分辨率。
該技術(shù)是AMD高級(jí)媒體框架(AMF)的一部分,基于著色器,改進(jìn)編碼時(shí)文本的質(zhì)量,不過(guò)僅支持Windows 11 DX應(yīng)用,且最高支持分辨率為1080p。
王啟尚還詳細(xì)介紹了AMD的兩種串流新技術(shù),都集成在A(yíng)MD錄制與直播中。
一是“串流預(yù)分析”(Pre-Analysis),可以分析視頻幀中每個(gè)區(qū)塊(block)的時(shí)間活動(dòng)和空間復(fù)雜性,并提取其他視頻屬性,比如場(chǎng)景變化、靜態(tài)場(chǎng)景、運(yùn)動(dòng)強(qiáng)度等。
根據(jù)所使用的前向緩沖區(qū)的深度,該技術(shù)可以在實(shí)際編碼之前,分析最多達(dá)40幀畫(huà)面,讓編碼器提前得知未來(lái)幀的特征,從而采取主動(dòng)行動(dòng),提升視頻畫(huà)面質(zhì)量。
此外,它還可以提高編碼效率,為視頻流中與其他塊有著更高相關(guān)性的塊提供更多的碼率。
還有“串流預(yù)濾波”(Pre-Filtering),一個(gè)低通感知保邊濾波器,可以去除幀畫(huà)面中視覺(jué)上不重要的細(xì)節(jié),而過(guò)濾強(qiáng)度可以根據(jù)視頻內(nèi)容、目標(biāo)碼率自適應(yīng),最終能在同等碼率下實(shí)現(xiàn)更高質(zhì)量的編碼。
——功耗:專(zhuān)注每瓦性能、小芯片設(shè)計(jì)有個(gè)最大優(yōu)勢(shì)
性能之外,用戶(hù)對(duì)于CPU處理器、GPU顯卡的功耗問(wèn)題越來(lái)越重視,畢竟,節(jié)能減排是社會(huì)大趨勢(shì),是綠色可持續(xù)發(fā)展的根本。在這方面,高能效的RDNA架構(gòu)正好契合。
王啟尚表示,提高性能以滿(mǎn)足不斷增長(zhǎng)的現(xiàn)代游戲需求是當(dāng)下、未來(lái)的重點(diǎn),需要不斷改進(jìn)芯片的設(shè)計(jì)和架構(gòu),但是提高性能的時(shí)候,一定又會(huì)產(chǎn)生更多的功耗,所以必須思考如何改變核心架構(gòu)。
RDNA3就充分體現(xiàn)了AMD在能效即每瓦性能上所花費(fèi)的大量心思,在RDNA2 提高54%的基礎(chǔ)上,再一次提高了54%,顯示了AMD有能力、有決心繼續(xù)打造更節(jié)能、更安靜、更低溫的顯卡。
比如RX 7900 XTX,對(duì)比上代RX 6950 XT,提供了大幅提高的性能和大量的新體驗(yàn),但功耗只增加了25W。
更進(jìn)一步,AMD在設(shè)計(jì)RX 7900系列顯卡時(shí),選擇了性能、功耗的更佳平衡點(diǎn),希望帶來(lái)更有能效的顯卡,不需要額外的轉(zhuǎn)接頭,兩個(gè)標(biāo)準(zhǔn)的8針電源接口即可供電。
而說(shuō)到功耗控制,就繞不開(kāi)制造工藝,其越先進(jìn),就可以帶來(lái)越好的能效。
RX 7900系列使用的是臺(tái)積電5nm制造工藝,而競(jìng)品RTX 40系列使用的是所謂臺(tái)積電4N。
對(duì)此,王啟尚表示,AMD和臺(tái)積電在制造工藝優(yōu)化方面有著很深的合作關(guān)系,RX 7900系列基于A(yíng)MD與臺(tái)積電合作開(kāi)發(fā)且調(diào)優(yōu)的5nm工藝,具有更高的功率、性能和更小面積。
對(duì)其他廠(chǎng)商可能使用市場(chǎng)叫法來(lái)命名其5nm制程工藝,王啟尚表示不發(fā)表任何評(píng)論。
此外,RX 7900系列第一次引入了chiplet小芯片設(shè)計(jì),就像AMD銳龍、霄龍?zhí)幚砥髯龅哪菢印?/p>
王啟尚提出,chiplet設(shè)計(jì)的最大優(yōu)勢(shì),就是便于選擇使用最合適的制造工藝完成適當(dāng)?shù)墓ぷ?,比如?jì)算核心使用比較昂貴的5nm工藝,實(shí)現(xiàn)出色的每瓦性能,I/O核心、Infinity Cache高速緩存則使用成熟的6nm工藝,最終在每個(gè)價(jià)位上實(shí)現(xiàn)更強(qiáng)的性能。
——競(jìng)爭(zhēng):RX 7900 XTX的真正對(duì)手是它!
有趣的是,我們的第一反應(yīng)是RX 7900 XTX要競(jìng)爭(zhēng)RX 4090,不過(guò)王啟尚表示,從市場(chǎng)定價(jià)來(lái)講,RX 7900 XTX對(duì)標(biāo)RTX 4080是更合適的,有著額外的8GB GDDR6顯存、更寬的384-bit位寬、領(lǐng)先的DisplayPort 2.1技術(shù)等。
順帶一提,王啟尚還確認(rèn),RX 7900系列顯卡沒(méi)有著色器執(zhí)行重排序(SER)。
在他看來(lái),在光線(xiàn)追蹤的實(shí)現(xiàn)中,將光線(xiàn)遍歷和光線(xiàn)著色混合在一起是沒(méi)有必要的。他表示:“你可以看到從RDNA 2到RDNA 3,在光追上面的比較,在性能上面其實(shí)有很大的進(jìn)步,所以我們覺(jué)得這樣混在一起對(duì)我們架構(gòu)來(lái)說(shuō)是沒(méi)有必要的?!?/p>
如果遍歷的速度很快,而著色成本又很高,那么這種做法顯然是十分有效的,可以提高著色的利用率,并分別處理遍歷與著色的需求。
可以說(shuō),RDNA3是王啟尚帶領(lǐng)團(tuán)隊(duì)親手培育養(yǎng)大的又一個(gè)好孩子,從種種設(shè)計(jì)和特性來(lái)看已經(jīng)展現(xiàn)出了不俗的實(shí)力,更加讓我們期待它解禁上市后秀出真正的實(shí)力。
尤其是在各種高端芯片產(chǎn)品功耗不斷膨脹的情況下,RDNA3依然有著如此出色的能效,以更小的代價(jià)實(shí)現(xiàn)更好的性能,帶來(lái)更好的體驗(yàn),值得整個(gè)行業(yè)思考和借鑒。
聯(lián)系客服