一、前言:性價(jià)比爆棚的GeForce RTX 40 SUPER系列顯卡
新一代的Ada Lovelace架構(gòu)帶來了令人咋舌的能效比,RTX 40系列顯卡在性能相同的情況下,功耗只有上代一半甚至更低,只是價(jià)格并不是那么親民。
2024年1月9日,NVIDIA發(fā)布了GeForce RTX 40 SUPER系列顯卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型號(hào)。
其中RTX 4070 SUPER以4899元的售價(jià)提供了接近于RTX 4070 Ti的性能;
而RTX 4070 Ti SUPER售價(jià)與RTX 4070 Ti同為6499元,但性能與9499元的RTX 4080相差無(wú)幾;
至于RTX 4080 SUPER,它在規(guī)格大幅度提升的情況下,將售價(jià)降到了8099元,比起RTX 4080足足便宜了1400元。
新一代RTX 40系列SUPER GPU的到來,瞬間讓NVIDIA顯卡性價(jià)比爆棚!

完整的AD104核心
RTX 4070 SUPER使用了與RTX 4070(Ti)相同的AD104核心。
完整的AD104核心共有7680個(gè)CUDA核心(分為5組GPC/30組TPC/60組SM)、240個(gè)第四代Tensor Core張量核心、60個(gè)第三代RT Core光追核心、240個(gè)紋理單元、80個(gè)ROP單元、3MB一級(jí)緩存、48MB二級(jí)緩存。

AD104-350核心(RTX 4070 SUPER)
RTX 4070 SUPER做了部分精簡(jiǎn),依然是5組GPC,只是將其中2組中的6個(gè)TPC減到了5個(gè),也就是5組GPC、28個(gè)TPC、7168個(gè)流處理器、228個(gè)Tensor Core、56個(gè)RT Core、80個(gè)ROP單元、36MB二級(jí)緩存。
除了二級(jí)緩存之外,其他規(guī)格削減不到7%,而顯存規(guī)格維持不變,可以想象,它的性能會(huì)非常接近RTX 4070 Ti。
RTX 4070 SUPER的詳細(xì)規(guī)格參數(shù)如下:

二、圖賞:與RTX 4070長(zhǎng)一樣 6+3相供電電路

包裝盒和RTX 4070公版差不多,區(qū)別在于原來是白字,現(xiàn)在改成了黑色字體。

開箱。

附贈(zèng)一條2x8Pin轉(zhuǎn)16Pin的電源線。

上面是RTX 4070 SUPER,下面是RTX 4070,長(zhǎng)相也幾乎一模一樣,差別在于4070的金屬條是銀灰色,4070 SUPER是深黑色,而且還能反光。

背面。

依然是16Pin供電接口,不過功耗很低,完全不用擔(dān)心燒化接口的情況。

3個(gè)DP1.4和1個(gè)HDMI 2.1接口。

沒有用均熱板,和RTX 4070一樣,都是銅底+熱管的散熱設(shè)計(jì)。

依舊是RTX 4070的PCB版,非常mini,改造成ITX版型也不難。
6+3相供電電路設(shè)計(jì),雖然簡(jiǎn)單,但也足夠應(yīng)付220W的TGP。

這是RTX 4070的PCB板,對(duì)比一下,二者區(qū)別在于RTX 4070多一個(gè)空焊位,也就是少一相供電。

PCB板背面。

RTX 4070 SUPER采用的是AD104-350核心,芯片面積295mm2,擁有358億晶體管。
GPU旁邊是6顆美光GDDR6X顯存,單顆2GB,總?cè)萘?2GB,等效頻率21GHz,帶寬504GB/s。
三、理論性能測(cè)試:3DMark運(yùn)行頻率可達(dá)2805MHz
測(cè)試平臺(tái)如下:

1、3DMark Fire Strike

在2K分辨率3DMark Fire Strike Extreme測(cè)試中,RTX 4070 SUPER圖形分?jǐn)?shù)達(dá)到了24185分,核心溫度最高68℃,熱點(diǎn)溫度最高85℃,核心運(yùn)行最高頻率為2805MHz,最高風(fēng)扇轉(zhuǎn)速1397PM,整卡最高功耗222W。

在4K分辨率3DMark Fire Strike Ultra測(cè)試中,RTX 4070 SUPER圖形分?jǐn)?shù)達(dá)到了12112分,核心溫度最高69℃,核心運(yùn)行最高頻率為2805MHz,最高風(fēng)扇轉(zhuǎn)速1397RPM,最高功耗222W。

2、3DMark Time Spy

在2K分辨率3DMark Time Spy測(cè)試中,RTX 4070 SUPER圖形分?jǐn)?shù)達(dá)到了20649分,核心溫度最高753℃,核心運(yùn)行最高頻率為2790Hz,最高風(fēng)扇轉(zhuǎn)速2028RPM,最高功耗223W。

在4K分辨率3DMark Time Spy Extreme測(cè)試中,RTX 4070 SUPER圖形分?jǐn)?shù)達(dá)到了9948分,核心溫度最高74℃,核心運(yùn)行最高頻率為2790Hz,最高風(fēng)扇轉(zhuǎn)速13990RPM,最高功耗224W。

四、1080P游戲性能測(cè)試:與RTX 3090 Ti旗鼓相當(dāng)
1、刺客信條:英靈殿


2、地平線:零之曙光


3、孤島驚魂5


4、孤島驚魂6


5、古墓麗影:暗影


6、霍格沃茨之遺

7、極限競(jìng)速:地平線5


8、賽博朋克2077


9、巫師3

10、無(wú)主之地3


11、星空


12、戰(zhàn)爭(zhēng)機(jī)器5


測(cè)試結(jié)果匯總?cè)缦拢?/p>

在1080P分辨率下,RTX 4070 SUPER的性能與RTX 3090 Ti不相上下,差距僅有1%。比起RTX 4070強(qiáng)了13%,和RTX 4070 Ti相比就差了3%。
六、2K性能測(cè)試:強(qiáng)于RTX 3080 Ti
1、刺客信條:英靈殿


2、地平線:零之曙光


3、孤島驚魂5


4、孤島驚魂6


5、古墓麗影:暗影


6、霍格沃茨之遺

7、極限競(jìng)速:地平線5


8、賽博朋克2077


9、巫師3

10、無(wú)主之地3


11、星空

12、戰(zhàn)爭(zhēng)機(jī)器5


測(cè)試數(shù)據(jù)匯總?cè)缦拢?/p>

2K分辨率下,RTX 4070 SUPER依然比RTX 3080 Ti強(qiáng)2%,與RTX 4070相比,也有14%的優(yōu)勢(shì),但是比RTX 4070 Ti則有5%的差距。
此外我們還測(cè)試了4K分辨率下的成績(jī),匯總?cè)缦拢?/p>

由于192Bit顯存位寬的關(guān)系,RTX 4070 SUPER在4K分辨率下的性能會(huì)明年不如RTX 3080 Ti,但大多數(shù)游戲依舊能保持60FPS以上的幀率。
我們測(cè)試的12款3A大作,有3款幀率低于60FPS,但這幾款游戲都支持DLSS 3,開啟之后幀率會(huì)有翻倍提升。
六、Stable Diffusion體驗(yàn):TensorRT加持 生圖速度提升350%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能讓具備Tensor單元的GeForce顯卡在Stable Diffusion Web UI中獲得翻倍的性能。
本次我們將對(duì)比SDXL加速方法與PyTorch xFormers(常規(guī)加速方法)的性能差異。

我們生成10張?zhí)沾髴?zhàn)圖像,分辨率1024*1024,使用PyTorch xFormers加速時(shí),耗時(shí)9分17秒。

使用SDXL加速之后,耗時(shí)僅為2分02秒,性能提升350%。

從終端中也可以看到,RTX 4070 SUPER使用默認(rèn)加速器時(shí),生圖速度只有1.1it/s,而在TensorRT加持下,生圖速度猛然提升到了4.50it/s。
七、DLSS 3游戲測(cè)試之一:3款DLSS 3游戲
此次我們一共測(cè)試了6款游戲,包括3款支持DLSS 3的游戲:《3DMark》、《毀滅全人類》、《燕云十六聲》。
另外還有3款同時(shí)支持DLSS與光追的游戲:《光明記憶》:《生死輪回》、《賽博朋克2077》。
所有DLSS 3以及光追測(cè)試都是在2K分辨率下進(jìn)行。
1、DLSS3 測(cè)試--燕云十六聲
《燕云十六聲》是一款開放世界中國(guó)風(fēng)武俠動(dòng)作游戲,畫質(zhì)精良,號(hào)稱國(guó)產(chǎn)3A破陣制作。目前這款游戲還處于內(nèi)測(cè)階段。

這款游戲于日前推送了對(duì)于DLSS 3支持的更新,下面我們來看看RTX 4070 SUPER SUPER的表現(xiàn),測(cè)試分辨率為2560*1440,畫質(zhì)選項(xiàng)為“超高”。
默認(rèn)超高畫質(zhì)下,游戲幀率為91FPS。
開啟DLSS 2(性能模式)之后,幀率達(dá)到了146FPS,提升了60%。
打開DLSS 3(插幀)之后,幀率來到了198FPS,相比默認(rèn)畫質(zhì)幀率提升了117%。

2、3DMark

DLSS 2模式下幀率為140FPS,比默認(rèn)的65FPS提升了133%。

DLSS 3的成績(jī)?yōu)?50FPS,相比默認(rèn)提升了150%。

3、毀滅全人類2:重新探測(cè)
最高畫質(zhì)下,RTX 4070 Ti的幀率為131FPS。
開啟DLSS 3之后,幀率來到了242FPS,近乎翻倍。

八、DLSS 3游戲測(cè)試之二:3款支持DLSS 3的光追游戲
1、光明記憶:無(wú)限
開啟RTX時(shí),游戲的幀率為109FPS。
開啟DLSS 3之后,幀率提升到了235FPS,提升了116%。

2、生死輪回
開啟光追之后,游戲的幀率僅有65FPS。
打開DLSS 3之后,幀率提升到了195FPS,提升幅度為195%。

3、賽博朋克2077
開啟光追時(shí),幀率為40FPS。
這是DLSS 3的畫面,與原生畫面的差距難以分辨,但是幀率提升到了155FPS。


九、功耗測(cè)試:2K游戲平均功耗僅為3080 Ti的62%

將Furmark的參數(shù)設(shè)定為1920*1200分辨率、0AA。
運(yùn)行13分鐘之后,RTX 4070 SUPER的溫度穩(wěn)定在74度附近,功耗穩(wěn)定在220W,烤機(jī)時(shí)GPU頻率為1620MHz,CPU風(fēng)扇轉(zhuǎn)速只有2153RPM。
2)、真實(shí)游戲功耗測(cè)試
1、GTA V
這是1080P分辨率。RTX 4070 SUPER功耗126W,溫度53度。

2K分辨率下,RTX 4070 SUPER功耗164W。
2、絕地求生

1080P分辨率下,RTX 4070 SUPER功耗203W,溫度689度,運(yùn)行頻率2760MHz。

2K分辨率下,RTX 4070 SUPER0功耗212W。
3、古墓麗影:暗影

1080P分辨率下,RTX 4070 SUPER的功耗為207W。

2K分辨率下,RTX 4070 SUPER功耗是212W,運(yùn)行頻率2745MHz,溫度64度。
測(cè)試數(shù)據(jù)匯總?cè)缦拢?/p>

在1080P分辨率下,RTX 4070 SUPER在3A游戲中的平均功耗不到200W,2K分辨率也只有207W;就算是到了4K分辨率,平均功耗也只有214W,僅相當(dāng)于RTX 3080 Ti的62%。
十、總結(jié):堪稱業(yè)界良心
本次測(cè)試小結(jié)如下:
1、AI性能
即使沒有TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion畫圖首選,而今在TensorRT加持下,RTX 4070 SUPER的生圖速度在原有基礎(chǔ)上提升了350%,這樣的表現(xiàn)相信是不會(huì)再有任何競(jìng)爭(zhēng)對(duì)手了。
2、1080P游戲性能

我們所測(cè)的12款游戲,除了《星空》之外 ,剩余11款游戲RTX 4070 SUPER的幀率全部都超過了160FPS,就連顯卡殺手《賽博朋克2077》也有169FPS。
就性能而言,1080P分辨率下,RTX 4070 SUPER幾乎能與RTX 3090 Ti并駕齊驅(qū),相比RTX 3080 Ti強(qiáng)了6%,比RTX 4070則強(qiáng)了13%,和4070 Ti的差距只有3%。
3、2K游戲性能

2K分辨率下,同樣是除了《星空》之外,RTX 4070 SUPER在其他11款游戲中都能保持120FPS以上的幀率。
在2K分辨率下,RTX 4070 SUPER依舊能比RTX 3080 Ti強(qiáng)2%,不過和RTX 4070 Ti的差距也拉大到了5%,比起RTX 4070則強(qiáng)了15%左右。
另外,我們也測(cè)試了4K,RTX 4070 SUPER在此分辨率下幀率會(huì)有較大損失,不過在絕大部分游戲中依舊能夠跑出60FPS以上的幀率。
少數(shù)幾款顯卡殺手游戲雖然幀率只有50PFS左右,但好在這些游戲都支持DLSS 3,開啟之后幀率甚至能突破100FPS。
4、功耗

我們測(cè)試了6款3A大作的真實(shí)游戲功耗,在1080P分辨率下,RTX 4070 SUPER的平均功耗是192W,而RTX 3080 Ti是312W。
2K分辨率下,RTX 4070 SUPER在6款游戲中的平均功耗是207W,RTX 3080 Ti則是332W。
4K分辨率下,RTX 4070 SUPER在6款游戲中的平均功耗為214W,RTX 3080 Ti則已經(jīng)跑到了350W的TGP上限。
5、DLSS 3和光追
目前能玩的DLSS 3游戲多達(dá)數(shù)十款,我們測(cè)試了6款。
在開啟DLSS 2之后,游戲幀率平均提升幅度為107%。打開DLSS 3,游戲幀率平均提升幅度達(dá)到了159%。
如今的NVIDIA GPU早已不是單純的游戲顯卡,特別是在AI應(yīng)用方面,有了SDXL,能將Stable Diffusion生圖速度提升4倍左右,讓原本已經(jīng)大幅度領(lǐng)先對(duì)手的N卡徹底無(wú)敵。
至于價(jià)格,4899元就能買到一塊1080P性能堪比RTX 3090 Ti、2K性能強(qiáng)于RTX 3080 Ti的顯卡,同時(shí)游戲功耗僅有200W左右,堪稱業(yè)界良心。
RTX 4070 SUPER只是開始,接下來的RTX 4070 Ti SUPER和RTX 4080 SUPER將會(huì)帶來更多的驚喜。
NVIDIAGeForceRTX40SIUPER系列現(xiàn)已上市,請(qǐng)到京東DIYSUPER超能年貨節(jié)上選購(gòu)GeForceRTX4070SUPER/4080SUPER公版和合作伙伴顯卡。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5594瀏覽量
109723 -
流處理器
+關(guān)注
關(guān)注
1文章
45瀏覽量
9629 -
CUDA
+關(guān)注
關(guān)注
0文章
127瀏覽量
14475 -
GPU芯片
+關(guān)注
關(guān)注
1文章
307瀏覽量
6517
原文標(biāo)題:2024年的第一張良心顯卡!RTX 4070 SUPER首發(fā)評(píng)測(cè)
文章出處:【微信號(hào):hdworld16,微信公眾號(hào):硬件世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
SCH5127 Super I/O 控制器:功能特性與設(shè)計(jì)應(yīng)用解析
深入解析LTC4070:高效的Li - Ion/Polymer電池充電解決方案
衷心感謝《瑞薩生態(tài)工作室》 ,授予我“優(yōu)秀評(píng)測(cè)獎(jiǎng)”!
NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)
NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試
AI眼鏡卷出新高度:夸克AI眼鏡首發(fā)Super Raw暗光增強(qiáng)算法+合像距調(diào)節(jié)
NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
PP-OCRv5 MCP服務(wù)器在海光主板的部署與實(shí)戰(zhàn)
NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析
FF宣布FX Super One啟動(dòng)試制生產(chǎn)階段
FX震撼發(fā)布全球首創(chuàng)FX Super One
NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載
ADUM4070集成反饋功能的隔離式開關(guān)調(diào)節(jié)器技術(shù)手冊(cè)
RTX 4070 SUPER首發(fā)評(píng)測(cè)
評(píng)論