近日,浪潮宣布為可重構AI計算發展計劃參與者提供最新FPGA加速卡支持。參與該計劃的高校將FPGA開源AI框架TF2應用于AI科研或應用并取得創新成果,并承諾將優化后代碼反饋回TF2開源社區,即可獲贈最新FPGA加速卡。同時,參與該計劃的商業用戶也可獲得較大程度的FPGA加速卡購買優惠。該計劃可在TF2開源社區(網址:https://github.com/TF2-Engine/TF2)進行申請。目前南開大學等知名高校已加入該計劃。
FPGA技術具有可定制性、低延遲和高性能功耗比等優勢,已成為諸多AI用戶部署推理應用的選擇。但FPGA技術進入到大規模AI業務部署仍舊存在軟件編寫門檻高、性能優化受限、功耗難以控制等諸多挑戰。為了應對這些挑戰,浪潮推出了開源的TF2框架。
TF2是全球首個完整方案的FPGA高效AI計算開源框架,可對模型進行壓縮、裁剪、量化等優化轉換以減少模型計算量,將模型文件自動轉化為FPGA目標運行文件,降低FPGA的AI軟件實現門檻,通過創新的DNN移位計算技術大幅提升FPGA做推理計算的性能,并有效降低其實際運行功耗,幫助用戶快速實現FPGA線上推理。在浪潮F10A FPGA卡上采用FaceNet模型對TF2進行的測試(BatchSize=1)表明,運行TF2后單張圖片的計算耗時為0.612ms,提速12.8倍。目前,TF2開源社區已吸引第四范式、快手、上海大學、華大智造、遠鑒科技、睿視智覺、華展匯元等多家領先公司或機構加入。
TF2計算加速流程
為了推動TF2社區建設,浪潮推出了可重構AI計算發展計劃,為參與者提供F10A、F37X等最新FPGA加速卡支持,鼓勵參與者將創新性成果反饋至社區,共同促進FPGA技術的開源開放合作發展,降低高性能AI計算技術門檻,加速AI應用落地。浪潮F10A是目前業界支持OpenCL的最高性能密度的FPGA加速卡,每瓦特性能達到42GFlops,已實現大規模應用部署,適用于數據中心AI推理、邊緣高密計算及桌面端應用加速等多種計算環境;浪潮F37X是全球首款集成HBM2的FPGA加速卡,可在75W典型功耗條件下,提供28.1TOPS INT8計算性能。此外,浪潮還將提供針對性的技術培訓和服務支持,并定期舉行開發者會議和線上公開課,分享最新技術進展和經驗成果。
浪潮AI&HPC總經理劉軍表示:“視覺、語音識別以及文本、語義理解等人工智能技術正在與各行業融合,以FPGA為代表的可重構計算將在各類線上推理場景中得到更廣泛的應用。浪潮希望通過可重構AI計算發展計劃促進TF2開源社區發展,同時增進開發者對最新FPGA計算加速技術的熟悉和了解,最大化釋放FPGA的計算潛力,加速產業AI化進程。”
浪潮是人工智能計算的領導品牌,AI服務器中國市場份額保持50%以上。并與人工智能領先科技公司保持在系統與應用方面的深入緊密合作,幫助AI客戶在語音、語義、圖像、視頻、搜索、網絡等方面取得數量級的應用性能提升。
-
FPGA
+關注
關注
1660文章
22412瀏覽量
636291 -
浪潮
+關注
關注
1文章
476瀏覽量
25418 -
AI
+關注
關注
91文章
39793瀏覽量
301385
發布評論請先 登錄
FPGA硬件加速卡設計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片
新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標準嵌入式開發板
昆侖芯R200 AI加速卡技術規格解析
邁向云端算力巔峰:昆侖芯K200 AI加速卡全面解讀
專為邊緣而生:深度解析昆侖芯K100 AI加速卡,釋放128 TOPS極致能效
以龍企招為例,淺談鴻蒙應用開發者激勵計劃 2025 參與心得
算力密度翻倍!江原D20加速卡發布,一卡雙芯重構AI推理標桿
智算加速卡是什么東西?它真能在AI戰場上干掉GPU和TPU!
邊緣AI運算革新 DeepX DX-M1 AI加速卡結合Rockchip RK3588多路物體檢測解決方案
Intel-Altera FPGA:通信行業的加速引擎,開啟高速互聯新時代
寒武紀基于思元370芯片的MLU370-X8 智能加速卡產品手冊詳解
RK3588核心板在邊緣AI計算中的顛覆性優勢與場景落地
邊緣AI新突破:MemryX AI加速卡與RK3588打造高效多路物體檢測方案
浪潮宣布為可重構AI計算發展計劃參與者提供最新FPGA加速卡支持
評論