電子發燒友網報道(文/李彎彎)NPU是一種專門為人工智能(AI)計算設計的處理器,主要用于高效執行神經網絡相關的運算(如矩陣乘法、卷積、激活函數等)。相較于傳統CPU/GPU,NPU在能效比和計算速度上更具優勢,尤其適合移動設備、邊緣計算和嵌入式AI場景。
NPU有幾大核心特點:其一是專用架構,針對神經網絡計算優化,支持并行處理大量矩陣運算(如INT8/FP16低精度計算),典型操作包括卷積、池化、注意力機制(Transformer)等;其二是高能效比,相比GPU,NPU的功耗更低,適合手機、IoT設備等對續航要求高的場景;其三是低延遲,專為AI推理(Inference)和訓練(Training)優化,減少數據搬運開銷;其四是異構計算,常與CPU、GPU、DSP等協同工作(如手機SoC中的“AI引擎”)。
NPU廣泛應用于各類AI驅動的設備與系統,典型場景包括:智能手機,實現實時圖像增強(如華為麒麟芯片的AI拍照)、語音助手、AR/VR交互等;可穿戴設備,支持低功耗的本地化AI計算(如智能手表的健康監測)。
自動駕駛,處理傳感器數據,實現實時物體檢測、路徑規劃和決策(如特斯拉FSD芯片)。典算力需求方面,L4級自動駕駛車輛NPU算力超1000 TOPS。
邊緣計算,如智能攝像頭,人臉識別、異常行為檢測。物聯網設備,本地化語音助手(如智能音箱的喚醒詞識別)。
數據中心,加速AI模型訓練和推理,典型應用如谷歌TPU(張量處理單元)。工業質檢,推理時延壓縮至20ms內,部署量年增120%。
典型NPU芯片有,如在移動端有華為麒麟芯片(達芬奇NPU),用于手機AI拍照、語音識別等;高通Hexagon DSP+NPU(驍龍平臺),支持AI降噪、影像增強;蘋果神經網絡引擎(A/M系列芯片),Face ID、Siri等功能的底層支持。
在邊緣計算和自動駕駛側有特斯拉FSD芯片,內置NPU處理自動駕駛視覺模型;地平線征程芯片(BPU架構),用于智能駕駛感知計算。
在云端,有寒武紀MLU系列,云端AI訓練/推理加速;英偉達Grace Hopper(集成NPU模塊),大模型推理。
NPU的關鍵技術包括量化壓縮,支持INT4/INT8低精度計算,提升能效;稀疏計算,跳過零值計算,加速稀疏模型(如Pruning后的網絡);編譯器優化,專用工具鏈(如華為Ascend CANN、高通AI Engine)將框架(TensorFlow/PyTorch)模型轉換為NPU指令。
從趨勢上來看,NPU有幾個明顯的發展方向:光電融合計算,結合光子學技術,進一步提升算力和能效;神經形態芯片,模仿生物神經元結構,實現更低功耗的AI計算;Chiplet技術,通過多NPU互聯提升算力(如Cerebras的Wafer級芯片)。
總的來看,NPU作為AI計算的核心硬件,正深刻改變著人工智能技術的落地方式。其高并行性、低功耗和硬件加速能力,使其成為移動設備、自動駕駛、邊緣計算等領域的首選解決方案。隨著技術演進和市場需求的爆發,NPU將在未來AI生態中扮演更加重要的角色。
-
gpu
+關注
關注
28文章
5177瀏覽量
135128 -
AI
+關注
關注
91文章
39489瀏覽量
300691 -
NPU
+關注
關注
2文章
372瀏覽量
21023
發布評論請先 登錄
合規利器:AM6-PW助力工商業光伏“輕裝上陣”
使用NORDIC AI的好處
GPU 利用率<30%?這款開源智算云平臺讓算力不浪費 1%
瑞芯微SOC智能視覺AI處理器
AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?
中小企業別慌:輕量化設備系統成新寵,低成本落地
簡化定位,從exgnss擴展庫開始:GNSS開發從此“輕裝上陣”
JBD蜂鳥Ⅱ:輕裝上陣、全彩出擊,輕量化AR解鎖全彩視覺體驗
超越CPU/GPU:NPU如何讓AI“輕裝上陣”?
評論