對許多 AI 工作負載而言,完全實現 GPU 廠商所宣稱的計算容量并非易事。即使對一般矩陣乘法 (GEMM) 等高度并行計算而言,GPU 也只能在某些大矩陣條件下實現高利用率。FPGA 提供了不同的 AI 優化硬件方法。
不同于 GPU,FPGA 提供了獨特的細粒度空間可重配置性,支持將每個功能的輸出直接傳送至相關功能的輸入,以滿足其需求。該方法可提升靈活性,支持特定的 AI 算法和應用特征,從而提高可用 FPGA 計算功能的利用率,進而提升性能。專用軟核處理器(也稱為疊加)支持與處理器類似的 FPGA 編程,即 FPGA 編程完全通過軟件工具鏈進行。這種編程方法可消除 FPGA 特定的硬件復雜性問題。
我們對全新英特爾 Stratix 10 NX FPGA 進行了首次性能評估,并將其與 Nvidia T4 和 V100 GPU 進行了比較。此次性能評估采用了 2020 年 IEEE 國際現場可編程技術會議中一篇論文所公布的結果,考察了一系列實時推理工作負載的運行表現。我們使用被稱為神經處理單元 (NPU) 的軟核 AI 處理器疊加實現方案部署了支持 FPGA 的工作負載,工具鏈支持以軟件為中心的 FPGA 編程,無需調用 FPGA 特定硬件 EDA 工具。
結果顯示,相比于測試的 GPU,英特爾 Stratix 10 NX FPGA 能夠為這些 AI 工作負載提供顯著改進的利用率和性能。
編輯:jq
-
處理器
+關注
關注
68文章
20255瀏覽量
252309 -
FPGA
+關注
關注
1660文章
22412瀏覽量
636344 -
gpu
+關注
關注
28文章
5194瀏覽量
135461 -
AI
+關注
關注
91文章
39793瀏覽量
301427
原文標題:英特爾?Stratix?10 NX FPGA為AI工作負載提供顯著改進的利用率和性能
文章出處:【微信號:英特爾FPGA,微信公眾號:英特爾FPGA】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
英特爾與華陽通用聯手推出全新AI Box解決方案
英特爾舉辦行業解決方案大會,共同打造機器人“芯”動脈
發力圖形工作站和AI推理市場,英特爾大顯存GPU亮相灣芯展
英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持
美國商務部推進收購英特爾10%股份 估值約達105億美元
英特爾發布邊緣AI控制器與邊緣智算一體機,創造“AI新視界”
直擊Computex 2025:英特爾重磅發布新一代GPU,圖形和AI性能躍升3.4倍
直擊Computex2025:英特爾重磅發布新一代GPU,圖形和AI性能躍升3.4倍
英特爾發布全新GPU,AI和工作站迎來新選擇
Intel-Altera FPGA:通信行業的加速引擎,開啟高速互聯新時代
盟通科技攜手Acontis助力英特爾虛擬化驅動工業負載整合
部署成本顯著降低!英特爾助陣高效AI算力一體機方案
英特爾借助開放生態系統,加速邊緣AI創新
英特爾?Stratix?10NX FPGA為AI工作負載提供顯著改進
評論