電子發燒友網報道(文 / 李彎彎)端側 AI 芯片,是專門為在諸如智能手機、IoT 設備、自動駕駛汽車等終端設備上,高效運行人工智能算法而設計的處理器。通過硬件級優化,它們能夠實現低功耗、高實時性的 AI 計算,構成了端側 AI 落地的核心硬件基礎。
為何需要端側 AI 芯片?隨著 AI 技術不斷發展,傳統芯片暴露出局限性。CPU 和 GPU 雖通用性強,但能效比較低,難以契合移動設備對功耗的嚴苛要求;依賴云端則會引發延遲、隱私以及網絡穩定性等問題。與之相比,專用端側 AI 芯片優勢顯著,具備高能效比、低延遲、隱私安全保障以及離線運行能力等特性。
端側 AI 芯片的核心技術涵蓋架構設計與關鍵技術創新等方面。在架構設計上,NPU(神經網絡處理單元)堪稱端側 AI 芯片的核心。它是專為神經網絡設計的加速器,像華為昇騰 NPU、Apple 神經引擎等,支持并行計算以及 INT8/FP16 低精度運算。
再者是異構計算架構,現代端側 AI 芯片普遍采用該架構,集成了 CPU、GPU、NPU、DSP(數字信號處理器)等多種計算單元,以應對各類不同的計算任務,高通 Hexagon 便是典型代表。
在關鍵技術創新方面,量化計算可支持 INT4/INT8 低精度運算,有效提升能效,聯發科 APU 就是范例;稀疏化加速技術能夠跳過零值權重計算,例如特斯拉 Dojo 芯片;存算一體技術可減少數據搬運功耗(即存內計算,如存算一體芯片);動態調度技術能夠依據任務負載動態分配算力,ARM Ethos NPU 便是如此。
主流的端側 AI 芯片廠商及產品有哪些?在此列舉部分廣為人知的廠商及其產品。華為海思昇騰(Ascend)系列,屬于面向邊緣推理的 AI 芯片,如 Ascend 310;麒麟 SoC 集成了 NPU,像麒麟 9000,可支持手機端 AI 任務。
高通驍龍移動平臺,部分型號支持端側 AI,比如驍龍 8 Gen 2 集成了 Hexagon 處理器,算力超過 60 TOPS;QCS 系列則是面向物聯網設備的 AI 芯片,例如 QCS8250 支持 15 TOPS 算力。
聯發科天璣系列集成了 AI 處理器,可支持端側 AI 任務。
蘋果 A 系列 / M 系列芯片集成了神經網絡引擎,像 A17 Pro 算力達 35 TOPS,M2 芯片算力達 15.8 TOPS。
三星 Exynos 系列,例如 Exynos Auto V 系列,是面向車用的 AI 芯片,算力超過 10 TOPS。
英特爾 Movidius VPU 專為視覺 AI 優化,比如 Myriad X 支持 4 TOPS 算力。
地平線(Horizon Robotics)征程系列面向自動駕駛和智能座艙,如征程 5 算力達 128 TOPS。
寒武紀(Cambricon)MLU 系列,像 MLU220 支持 8 TOPS 算力,面向邊緣推理。
全志科技(Allwinner)V/R 系列,例如 V853 集成了 NPU,算力 1.2 TOPS,適用于智能攝像頭。
瑞芯微(Rockchip)RK3588 內置 6 TOPS NPU,支持旗艦級邊緣計算。
當前,端側 AI 芯片的發展面臨諸多挑戰:在能效平衡方面,移動設備需要在 1W 以下功耗實現 TOPS 級算力;算法適配層面,芯片需要支持動態稀疏化、混合精度等前沿算法;開發門檻上,存在廠商專用工具鏈(如華為 MindSpore Lite)與通用框架(TensorFlow Lite)的兼容性問題;碎片化生態方面,不同廠商的 NPU 指令集和編譯器存在差異,導致移植成本居高不下。
從發展趨勢來看,隨著 AI 模型復雜度提升,端側 AI 芯片的算力會持續增強,同時維持低功耗狀態。端側 AI 芯片將支持多模態數據(如圖像、語音、傳感器數據)的融合處理,從而拓展更為豐富的應用場景。輕量化模型(如 MobileNet、EfficientNet)和神經架構搜索(NAS)技術將進一步優化端側 AI 的性能。端側 AI 芯片與云端 AI 的協同作業將成為主流模式,復雜任務交由云端處理,實時任務則由端側設備完成。
總而言之,端側 AI 芯片是推動 AI 技術在終端設備落地的核心硬件,其發展將對智能手機、智能穿戴、自動駕駛、工業物聯網等眾多領域產生深遠影響。盡管目前面臨一些挑戰,但未來端側 AI 芯片必將朝著更高算力、更低功耗、更強安全性以及更豐富應用場景的方向邁進。
為何需要端側 AI 芯片?隨著 AI 技術不斷發展,傳統芯片暴露出局限性。CPU 和 GPU 雖通用性強,但能效比較低,難以契合移動設備對功耗的嚴苛要求;依賴云端則會引發延遲、隱私以及網絡穩定性等問題。與之相比,專用端側 AI 芯片優勢顯著,具備高能效比、低延遲、隱私安全保障以及離線運行能力等特性。
端側 AI 芯片的核心技術涵蓋架構設計與關鍵技術創新等方面。在架構設計上,NPU(神經網絡處理單元)堪稱端側 AI 芯片的核心。它是專為神經網絡設計的加速器,像華為昇騰 NPU、Apple 神經引擎等,支持并行計算以及 INT8/FP16 低精度運算。
再者是異構計算架構,現代端側 AI 芯片普遍采用該架構,集成了 CPU、GPU、NPU、DSP(數字信號處理器)等多種計算單元,以應對各類不同的計算任務,高通 Hexagon 便是典型代表。
在關鍵技術創新方面,量化計算可支持 INT4/INT8 低精度運算,有效提升能效,聯發科 APU 就是范例;稀疏化加速技術能夠跳過零值權重計算,例如特斯拉 Dojo 芯片;存算一體技術可減少數據搬運功耗(即存內計算,如存算一體芯片);動態調度技術能夠依據任務負載動態分配算力,ARM Ethos NPU 便是如此。
主流的端側 AI 芯片廠商及產品有哪些?在此列舉部分廣為人知的廠商及其產品。華為海思昇騰(Ascend)系列,屬于面向邊緣推理的 AI 芯片,如 Ascend 310;麒麟 SoC 集成了 NPU,像麒麟 9000,可支持手機端 AI 任務。
高通驍龍移動平臺,部分型號支持端側 AI,比如驍龍 8 Gen 2 集成了 Hexagon 處理器,算力超過 60 TOPS;QCS 系列則是面向物聯網設備的 AI 芯片,例如 QCS8250 支持 15 TOPS 算力。
聯發科天璣系列集成了 AI 處理器,可支持端側 AI 任務。
蘋果 A 系列 / M 系列芯片集成了神經網絡引擎,像 A17 Pro 算力達 35 TOPS,M2 芯片算力達 15.8 TOPS。
三星 Exynos 系列,例如 Exynos Auto V 系列,是面向車用的 AI 芯片,算力超過 10 TOPS。
英特爾 Movidius VPU 專為視覺 AI 優化,比如 Myriad X 支持 4 TOPS 算力。
地平線(Horizon Robotics)征程系列面向自動駕駛和智能座艙,如征程 5 算力達 128 TOPS。
寒武紀(Cambricon)MLU 系列,像 MLU220 支持 8 TOPS 算力,面向邊緣推理。
全志科技(Allwinner)V/R 系列,例如 V853 集成了 NPU,算力 1.2 TOPS,適用于智能攝像頭。
瑞芯微(Rockchip)RK3588 內置 6 TOPS NPU,支持旗艦級邊緣計算。
當前,端側 AI 芯片的發展面臨諸多挑戰:在能效平衡方面,移動設備需要在 1W 以下功耗實現 TOPS 級算力;算法適配層面,芯片需要支持動態稀疏化、混合精度等前沿算法;開發門檻上,存在廠商專用工具鏈(如華為 MindSpore Lite)與通用框架(TensorFlow Lite)的兼容性問題;碎片化生態方面,不同廠商的 NPU 指令集和編譯器存在差異,導致移植成本居高不下。
從發展趨勢來看,隨著 AI 模型復雜度提升,端側 AI 芯片的算力會持續增強,同時維持低功耗狀態。端側 AI 芯片將支持多模態數據(如圖像、語音、傳感器數據)的融合處理,從而拓展更為豐富的應用場景。輕量化模型(如 MobileNet、EfficientNet)和神經架構搜索(NAS)技術將進一步優化端側 AI 的性能。端側 AI 芯片與云端 AI 的協同作業將成為主流模式,復雜任務交由云端處理,實時任務則由端側設備完成。
總而言之,端側 AI 芯片是推動 AI 技術在終端設備落地的核心硬件,其發展將對智能手機、智能穿戴、自動駕駛、工業物聯網等眾多領域產生深遠影響。盡管目前面臨一些挑戰,但未來端側 AI 芯片必將朝著更高算力、更低功耗、更強安全性以及更豐富應用場景的方向邁進。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI芯片
+關注
關注
17文章
2122瀏覽量
36710
發布評論請先 登錄
相關推薦
熱點推薦
安謀科技:端側NPU技術創新,拉動AI算力落地引擎
X3 NPU IP以及生態建設、NPU發展趨勢等話題。 ? 圖:安謀科技產品總監鮑敏祺 ? 周易X3 NPU IP正當時 ? 安謀科技周易X3 NPU IP面向端側AI落地需求,基于專
全志V861系列芯片推動端側AI視覺應用落地
全志V861系列智能視覺處理芯片,以運力、算力雙維減耗為核心設計理念,通過異構計算架構與AI-ISP硬件單元的深度協同,在保證高性能的同時顯著優化系統資源消耗,同時形成最新低功耗解決方
信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代
DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發的新一代AI大模型。其核心優勢
發表于 07-16 15:29
RISC-V架構+Timesformer引擎:時擎科技自研算法賦能端側AI多場景落地
引發了隱私安全的擔憂。 ? 與此同時,終端設備智能化升級的需求日益迫切,如智能耳機需具備本地語音識別能力,工業設備需實現實時缺陷檢測等。這些需求共同推動了“云-邊-端”協同計算架構的普
AI大模型端側部署正當時:移遠端側AI大模型解決方案,激活場景智能新范式
AI大模型解決方案備受矚目,為AI設備的革新注入了澎湃動力。 萬億級市場藍海顯現,端側AI大模型加速落地
發表于 03-27 11:26
?540次閱讀
兩大芯片廠商比拼端側AI音頻芯片,高算力藍牙6.0成亮點
(電子發燒友網綜合報道)隨著人工智能技術的飛速發展,AI芯片作為其核心硬件支撐,正逐漸從云端向端側
端側 AI 芯片:終端智能落地的核心引擎
評論