芯原股份今日宣布其超低能耗且高性能的神經網絡處理器(NPU)IP現已支持在移動端進行大語言模型(LLM)推理,AI算力可擴展至40 TOPS以上。該高能效NPU架構專為滿足移動平臺日益增長的生成式AI需求而設計,不僅能夠為AI PC等終端設備提供強勁算力支持,而且能夠應對智慧手機等移動終端對低能耗更為嚴苛的挑戰。
芯原的超低能耗NPU IP具備高度可配置、可擴展的架構,支持混合精度計算、稀疏化優化和并行處理。其設計融合了高效的內存管理與稀疏感知加速技術,顯著降低計算負載與延遲,確保AI處理流暢、響應迅速。該NPU支持數百種AI算法,如AI降噪(AI-NR)和AI超分(AI-SR)等,并兼容Stable Diffusion和LLaMA-7B等主流AI模型。同時,該NPU IP還可與芯原其他處理器IP無縫集成,實現異構計算,助力SoC設計者打造滿足多元化應用需求的AI解決方案。
此外,芯原的超低能耗NPU IP還支持TensorFlow Lite、ONNX和PyTorch等主流AI框架,可加速客戶在不同AI應用場景中的部署進程并簡化集成工作。
“智能手機等移動設備正逐步演變為個人AI服務器。隨著生成式AI(AIGC)和多模態大語言模型技術的快速發展,市場對AI算力的需求呈指數級增長,并已成為移動產品的關鍵差異化要素。”芯原首席戰略官、執行副總裁、IP事業部總經理戴偉進表示,“在支持高強度AI計算負載的過程中,能耗控制是最關鍵的挑戰之一。芯原持續深耕面向智慧手機和AI PC的超低能耗的NPU研發,并通過與主流SoC合作伙伴的緊密協作,見證了該技術在新一代智慧手機和AI PC中實現量產。”
審核編輯 黃宇
-
芯片
+關注
關注
463文章
54007瀏覽量
465900 -
低能耗
+關注
關注
0文章
28瀏覽量
11761 -
NPU
+關注
關注
2文章
373瀏覽量
21086 -
算力
+關注
關注
2文章
1528瀏覽量
16740
發布評論請先 登錄
零碳園區建筑基礎架構規劃:超低能耗標準下的地基與墻體構造設計
邁向云端算力巔峰:昆侖芯K200 AI加速卡全面解讀
國產AI芯片真能扛住“算力內卷”?海思昇騰的這波操作藏了多少細節?
米爾RK3576部署端側多模態多輪對話,6TOPS算力驅動30億參數LLM
基于米爾瑞芯微RK3576開發板的Qwen2-VL-3B模型NPU多模態部署評測
天璣9500 性能大爆發!NPU AI算力或達100TOPS
積算科技上線赤兔推理引擎服務,創新解鎖FP8大模型算力
基于米爾瑞芯微RK3576開發板部署運行TinyMaix:超輕量級推理框架
揭秘瑞芯微算力協處理器,RK3576/RK3588強大算力搭檔
超低延時重構AI推理體驗!白山云發布“大模型API”產品
芯原超低能耗NPU可為移動端大語言模型推理提供超40 TOPS算力
評論