越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell是全新 NVIDIA Blackwell 架構 GPU 中的中端專業圖形卡,高度僅為全高 GPU 的二分之一。如果您需要的是一塊半高顯卡,能適配小機箱,功耗不高,還要具備 AI 及光線追蹤性能的話,那么 RTX PRO 2000 是很好的選擇。
今天我們帶來全新NVIDIA RTX PRO2000 Blackwell的測試,對比上一代產品 NVIDIA RTX 2000 Ada Generation 具體有哪些提升。
測試環境

軟件測試列表

顯卡規格

軟件測試結果及分析
1. 計算性能:CUDA-Z
CUDA-Z 和 CPU-Z、GPU-Z 相類似,能直觀地展現 GPU 顯卡的一些性能信息。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
2025 麗臺(上海)信息科技有限公司
本文所有測試結果均由麗臺科技實測得出,如果您有任何疑問或需要使用此測試結果,請聯系麗臺科技(下同)
單精度浮點運算性能是顯卡一項重要的指標,很多計算都是使用單精度完成的。從測試結果來看,RTX PRO 2000 Blackwell 的單精度和 32 位整數計算能力是 RTX 2000 Ada 的1.78倍,RTX PRO 2000 的雙精度性能是 RTX 2000 Ada 的1.61倍,RTX PRO 2000 的 64 位整數計算能力是 RTX 2000 Ada 的1.48倍,RTX PRO 2000 的 24 位整數計算能力是 RTX 2000 Ada 的1.67倍。
2. 圖形性能:SPECviewperf 15
SPECviewperf 15 主要是用來評測顯卡專業圖形性能的軟件,其中包括了我們常見的 3ds Max、Maya、Catia、SolidWorks、Creo、Blender、Enscape、Unreal_engine 軟件性能測試,以及醫療和能量仿真性能測試。通過模擬對軟件場景的交互操作的速度來評分,最終得出顯卡的圖形性能的相對性能。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
從 SPECviewperf 15 的測試結果看,RTX PRO 2000 和 RTX 2000 Ada 的圖形交互性能在 Unreal_engine、Medical、Maya、3ds Max的測試中均有1.4倍左右的提升。RTX PRO 2000 在 Solidworks、Creo、Catia、blender 的測試中是 RTX 2000 Ada 的1.5倍左右,RTX PRO 2000 在 Energy 的測試中是 RTX 2000 Ada 的1.72倍,RTX PRO 2000 在 Enscape 的測試中是 RTX 2000 Ada 的2.33倍,圖形性能普遍提升。
3. 實時渲染性能
3.1 FurMark
FurMark 是 GPU 測試中常用工具,可以做 OpenGL 性能測試,主要用于評估 GPU 性能級穩定性測試。本次測試 OpenGL 的 4K 實時渲染圖形性能,以及室溫下 GPU 散熱表現。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
從 FurMark 的實時渲染測試結果中可以看出, RTX PRO 2000 的 OpenGL 4K 性能是 RTX 2000 Ada 的1.46倍。通過長時間烤機(穩定性測試),RTX PRO 2000 的溫度控制在 76 度以下。這個溫度是在顯卡滿載運行的情況下測得的,反映了 RTX PRO 2000 在高負載下的散熱能力。
3.2 3DMark
3DMark 主要是測試基于大型 3D 場景圖形性能的軟件,此次測試我們找了兩個相對較大的場景進行測試,并測試了 DXR 和 Vulkan 的性能,使用 Port Royal 測試光追的性能。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
從 3DMark Steel Nomad 的測試結果看,基于 DX 和 Vulkan 的性能測試,RTX PRO 2000 的性能是 RTX 2000 Ada 的1.4倍。在 Port Royal 光追性能測試中 RTX PRO 2000 是 RTX 2000 Ada 的1.5倍。RTX PRO 2000 的渲染性能和光追性能都有了很大的提高。
3.3 NVIDIA Omniverse 工作流實時渲染
NVIDIA Omniverse 是一個包含 API、SDK 和服務的平臺,使開發者能夠將 OpenUSD、NVIDIA RTX 渲染技術和生成式物理 AI 集成到工業和機器人用例的現有軟件工具和仿真工作流中。可以支持多人同時在線進行 3D 立體場景的協同搭建,支持豐富的 DCC 生態融合,可以支持光線追蹤極具真實感的實時渲染。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
在 Omniverse 實時渲染中,分別測試了開啟 NVIDIA DLSS 和關閉 DLSS 進行測試。針對相同場景的 4K 實時渲染,在啟用 DLSS 時 RTX PRO 2000 的性能是 RTX 2000 Ada 的5.6倍性能,在不啟用 DLSS 時,RTX PRO 2000 的性能是 RTX 2000 Ada 的3.2倍。由于 RTX PRO 2000 具備第 5 代的 Tensor Core,并且支持最新一代的 NVIDIA DLSS 4,因此在開啟 DLSS 功能后增幀效果顯著。
4. 離線渲染性能
渲染在媒體娛樂、設計制造以及建筑行業被廣泛的應用,目前很多渲染器均支持 GPU 渲染,而 GPU 渲染的速度就取決于顯卡的計算速度。
4.1 V-Ray Benchmark
V-Ray Benchmark 是一款免費的獨立渲染速度測試軟件,用于測試您計算機的渲染速度。它可以簡單快速的測試兩種渲染引擎:
> V-Ray GPU CUDA — GPU 渲染模式測試
> V-Ray GPU RTX — RTX GPU 渲染模式測試
本次測試不同 GPU 在不同 V-Ray 5 渲染引擎下的離線渲染性能,并記錄最終得分。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
在使用 CUDA 和 RTX 渲染測試中,RTX PRO 2000 的性能都是 RTX 2000 Ada 的1.42倍。
4.2 Blender Benchmark
在 Blender Benchmark 中分別使用 3 個場景 monster、junkshop、classroom 進行渲染性能的測試。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
其中在 monster 場景的測試中,RTX PRO 2000 是 RTX 2000 Ada 的1.22倍。在 junkshop 的測試中 RTX PRO 2000 是 RTX 2000 Ada 的1.23倍。在 classroom 的測試中 RTX PRO 2000 是 RTX 2000 Ada 的1.17倍。
5. AI 性能測試
Procyon 推出了面向專業用戶的基準測試。Procyon 是 UL 專為工業、企業、政府、零售和媒體領域的專業用戶打造的全新基準測試套件。每個 Procyon 基準測試都采用通用的設計和功能集,提供熟悉且一致的體驗。靈活的許可機制意味著您可以根據自身需求選擇最合適的基準測試。
隨著更多測試即將推出,Procyon 基準測試套件將很快為專業用戶提供一系列基準測試和性能測試。每個基準測試都針對特定用例而設計,并盡可能使用真實的應用程序。
5.1 AI Compute Video benchmark
在此項測試中,我們選擇 NVIDIA TensorRT 來進行測試 NVIDIA GPU 的推理性能,使用精度 Float16 進行推理計算,推理速度越快,得分越高。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
針對 AI 視頻計算在 TensorRT Float16 位精度的測試中,RTX PRO 2000 是 RTX 2000 Ada 的1.30倍。
5.2 AI Text Generation Benchmark
在此項測試中,軟件分別使用 4 個模型進行測試,分別基于 Llama 2、Llama 3.1、Mistral 7B、Phi 3.5 四個大模型進行推理生成,通過推理速度相對應的時間來對比 GPU 的性能。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
從上圖測試的結果來看,在 Llama 2 測試中 RTX PRO 2000 是 RTX 2000 Ada 的1.40倍。在 Llama 3.1 測試中 RTX PRO 2000 是 RTX 2000 Ada 的1.34倍。在 Mistral 7B 測試中 RTX PRO 2000 是 RTX 2000 Ada 的1.38倍。在 Phi 3.5 測試中 RTX PRO 2000 是 RTX 2000 Ada 的1.31倍。
5.3 AI Image Generation Benchmark
本項測試 Procyon 將調用 Stable Diffusion XL 進行測試,分別使用 FP16、W8A16 以及 XL 版本 FP16 進行推測試,來測試 GPU 的圖像生成性能。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
從上圖測試的結果來看,使用 Stable Diffusion 1.5 Light 進行測試時,RTX PRO 2000 是 RTX 2000 Ada 的1.35倍。使用 Stable Diffusion 1.5 FP16 精度進行測試時,RTX PRO 2000 是 RTX 2000 Ada 的1.53倍。在 SDXL 中使用 FP16 精度測試,RTX PRO 2000 是 RTX 2000 Ada 的1.51倍。
5.4 Flux.1 AI Image Generation
使用 Flux.1 量化 FP4 的模型,對比上一代產品使用 FP8 精度的生成速度。

▲ RTX PRO 2000 Blackwell 測試結果截圖

▲ 測試結果圖表
由于 Blackwell 架構的 Tensor Core 可以支持 FP4 精度的推理,所以在很多 AIGC 的應用領域中,在不影響生成質量的情況下可以使用 FP4 來進行加速生成。而上一代 Ada Lovelace 架構的產品僅支持 FP8,在這種情況下,在相同的任務下使用 RTX PRO 2000 的性能是 RTX 2000 Ada 的6.14倍。
總結
NVIDIA RTX PRO 2000 Blackwell GPU 采用節能高效的緊湊外觀規格,可提供卓越的性能。測試結果表明,其綜合性能較前代產品 RTX 2000 Ada 有大幅提升。
CUDA 核心數相較上一代產品增加了 54%,因此在諸多應用場景下性能都有了很大的提高。
在 AI 性能方面,第 5 代 Tensor Core 增加了對 FP4 精度的支持,并結合 GDDR7 顯存,可加速 AI 增強型工作流,所以這個功能未來會在 AI 推理上會有很大的應用,對應的推理性能也會有很大提升。原本使用 FP16 或者 FP8 的推理的場景,也有了 30%~50% 的提升。
在 DLSS 的應用上,可以支持最新的幀生成技術,從 Omniverse 的測試中可以看出,對實時渲染的幀數確實有很大的提升作用。
在專業 CAD 和 DCC 的交互性能提升幅度巨大,可以適配小機箱,支持更多的工業制圖、DCC 內容生產的更大應用場景。
在離線渲染方面也有了 20%~40% 的性能提升,渲染出圖或者視頻的性能會更快。
綜上所述,在半高專業圖形卡中,NVIDIA RTX PRO 2000 憑借其緊湊的外型及出眾的性能,在新技術的加持下,為小機箱用戶提供了更好的選擇。此外 RTX PRO 2000 帶有全高檔片,也可適配于 4U 全高機箱,結構緊湊,性能強大。
-
NVIDIA
+關注
關注
14文章
5513瀏覽量
109200 -
gpu
+關注
關注
28文章
5118瀏覽量
134556 -
AI
+關注
關注
90文章
38414瀏覽量
297708
原文標題:小巧機身,強大 AI:NVIDIA RTX PRO 2000 Blackwell 測評解讀
文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄

NVIDIA RTX PRO 2000 Blackwell GPU性能測試
評論