AI算力已成為數(shù)字經(jīng)濟(jì)時代的核心生產(chǎn)力,但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計,行業(yè)算力資源平均利用率僅為30%~40%,存在嚴(yán)重的算力浪費(fèi)現(xiàn)象。國內(nèi)領(lǐng)先的科技企業(yè)也在近期表示,將通過軟件層創(chuàng)新大幅提升算力資源利用率。
作為高算力AI模組和端側(cè)AI領(lǐng)域的領(lǐng)先企業(yè),美格智能長期專注于端側(cè)AI算力的優(yōu)化與提升,通過深耕SoC架構(gòu)、容器化和虛擬化、內(nèi)存帶寬壓縮、算法量化、電源策略優(yōu)化等關(guān)鍵技術(shù),美格智能在端側(cè)AI領(lǐng)域形成了獨(dú)特的“軟件+硬件”協(xié)同優(yōu)勢,為提升AI算力利用率提供了一整套完整方案。
優(yōu)化SoC架構(gòu)調(diào)度:激發(fā) CPU + GPU + NPU 算力協(xié)同潛能
異構(gòu)計算架構(gòu)是現(xiàn)代SoC芯片的核心優(yōu)勢。美格智能多年深耕SoC架構(gòu),通過軟硬協(xié)同優(yōu)化最大化利用平臺AI算力,充分發(fā)揮每個處理器的獨(dú)特優(yōu)勢:CPU擅長順序控制和通用任務(wù),GPU適合并行數(shù)據(jù)流處理,而NPU則專精于標(biāo)量、向量和張量數(shù)學(xué)運(yùn)算,是AI工作負(fù)載的核心執(zhí)行單元。

美格智能具備領(lǐng)先的SoC集成開發(fā)、性能調(diào)度和智能化系統(tǒng)研發(fā)能力,并積累了豐富的高算力AI應(yīng)用和虛擬化經(jīng)驗(yàn)。針對AI算法應(yīng)用特點(diǎn),美格智能進(jìn)行了針對性的大型算法調(diào)度和多算法并行調(diào)整。
在大型算法調(diào)度方面:通過將大型算法拆分與并行處理,將復(fù)雜AI算法拆解成多個部分,根據(jù)CPU、GPU、NPU的算力特性,分別加載不同部分至相應(yīng)處理器,基于流水線作業(yè)實(shí)現(xiàn)算力并行和多算法負(fù)載均衡。
在多算法并行調(diào)整方面:根據(jù)各個算法對算力的不同需求,合理分配算法到最合適的處理器上運(yùn)行,避免資源爭搶和閑置,從而實(shí)現(xiàn)算力資源的充分利用。
突破內(nèi)存墻瓶頸:以壓縮與量化技術(shù)提升計算效率
內(nèi)存帶寬壓縮技術(shù)通過在有限內(nèi)存帶寬下交換更多數(shù)據(jù),顯著降低了內(nèi)存訪問瓶頸對算力發(fā)揮的影響。該技術(shù)利用LPDDR5X內(nèi)存提供超過120GB/s的帶寬,滿足7B模型推理時的高吞吐需求。
算法量化技術(shù)基于量化感知的混合量化方案,部分層使用INT4精度,在精度損失可控的情況下進(jìn)一步降低計算開銷,提升處理速度。具體實(shí)現(xiàn)包括:
混合精度量化:美格智能支持INT4/FP8混合精度計算,與DeepSeek-R1模型的量化格式高度適配。以7B參數(shù)模型為例,經(jīng)INT4量化后,模型體積從FP32所需的28GB壓縮至僅2-4GB,大幅降低存儲和內(nèi)存占用。
量化感知訓(xùn)練(QAT):在模型訓(xùn)練過程中插入偽量化節(jié)點(diǎn)模擬量化效果,使模型在訓(xùn)練階段即適應(yīng)低精度計算,顯著減少量化后的精度損失。
訓(xùn)練后量化(PTQ):使用少量校準(zhǔn)數(shù)據(jù)估計權(quán)重和激活值的動態(tài)范圍,確定量化參數(shù),無需重新訓(xùn)練即可實(shí)現(xiàn)模型壓縮,適配周期縮短50%。

強(qiáng)化電源與散熱設(shè)計:為高算力持續(xù)輸出保駕護(hù)航
除了計算和內(nèi)存優(yōu)化,電源管理和散熱設(shè)計同樣直接影響算力利用率的穩(wěn)定性和持續(xù)性。美格智能通過多維度創(chuàng)新確保端側(cè)設(shè)備在功耗約束下保持穩(wěn)定性能。
在電源管理方面:
精細(xì)化功耗調(diào)度:模組內(nèi)置的電源管理芯片(PMIC)可對SoC上不同計算單元(CPU/GPU/NPU)的供電進(jìn)行獨(dú)立監(jiān)控和動態(tài)調(diào)節(jié)。系統(tǒng)會根據(jù)實(shí)時算力需求,智能調(diào)整各單元的工作電壓和頻率(DVFS技術(shù)),在滿足性能需求的同時,將整體功耗降至最低。
分級供電與智能待機(jī):模組為處理器、內(nèi)存及通信單元提供了獨(dú)立的供電域。在低負(fù)載場景下,可自動關(guān)閉非必要功能單元的供電,或使其進(jìn)入低功耗休眠狀態(tài),顯著降低待機(jī)功耗,這對于依賴電池供電的移動設(shè)備至關(guān)重要。
在散熱優(yōu)化方面:
SIP系統(tǒng)級封裝與Underfill工藝:在高端車規(guī)級模組中,美格智能采用SIP(系統(tǒng)級封裝)技術(shù),將多顆芯片高密度集成。通過引入Underfill(底部填充)工藝,在芯片與基板間填充特殊配方的膠水,這不僅顯著增強(qiáng)了模組在振動、冷熱沖擊環(huán)境下的機(jī)械可靠性,其填充材料本身也成為了輔助芯片散熱的重要路徑,能將熱量更均勻地傳導(dǎo)至模組基板,優(yōu)化整體散熱性能。
一體化散熱與結(jié)構(gòu)優(yōu)化:美格智能的高算力AI模組(如AI算力盒子)采用一體散熱設(shè)計,確保在長時間持續(xù)運(yùn)行下性能穩(wěn)定。在結(jié)構(gòu)上,通過優(yōu)化模組內(nèi)部布局和采用高熱導(dǎo)率材料,打造高效熱傳導(dǎo)路徑。例如,部分模組會集成屏蔽罩或散熱蓋板,與芯片表面緊密貼合,充當(dāng)“導(dǎo)熱橋”,將熱量快速導(dǎo)向模組外殼或設(shè)備的外部散熱系統(tǒng)。
推動端側(cè)落地:以全場景AI模組賦能行業(yè)智能化升級
美格智能的技術(shù)理念不僅停留在理論層面,更通過一系列產(chǎn)品落地和實(shí)際用例實(shí)現(xiàn)了端側(cè)AI算力的高效利用,通過專注于端側(cè)AI算力的優(yōu)化與提升,形成了自己獨(dú)特的競爭優(yōu)勢。
美格智能的高算力AI模組產(chǎn)品涵蓋入門級、中端、旗艦級多層次,對應(yīng)AI算力覆蓋0.2TOPS-100TOPS,能夠在各類邊緣計算終端、機(jī)器人、智能汽車域控制器等設(shè)備上執(zhí)行多種類型的端側(cè)計算任務(wù)。這種全面布局使得美格智能能夠根據(jù)不同的應(yīng)用場景需求,提供最合適的算力解決方案,避免“過度配置”或“配置不足”造成的算力浪費(fèi)。
美格智能在5G與AI融合方面也有深入布局,其推出的5G-A+Wi-Fi 7雙擎?zhèn)鬏敺桨钢С秩f兆速率與智能天線陣列,為端側(cè)AI應(yīng)用提供了高速、低延遲的連接保障。通過“本地AI引擎+云端大模型”雙軌架構(gòu),美格智能實(shí)現(xiàn)了從設(shè)備層到應(yīng)用層的全棧智能化升級,這種端云協(xié)同架構(gòu)既利用了端側(cè)算力的高效性,又保留了云端算力的無限擴(kuò)展性。
在人形機(jī)器人、智能座艙、無人機(jī)、智能安防、智能家居等場景中,高效的端側(cè)算力正在發(fā)揮越來越重要的作用。未來,隨著AIGC與物聯(lián)網(wǎng)的進(jìn)一步融合,美格智能有望通過其“軟件+硬件”協(xié)同優(yōu)化的特色路徑,在加速人工智能產(chǎn)業(yè)發(fā)展的征程中扮演更為重要的角色。
-
cpu
+關(guān)注
關(guān)注
68文章
11229瀏覽量
223226 -
gpu
+關(guān)注
關(guān)注
28文章
5118瀏覽量
134556 -
NPU
+關(guān)注
關(guān)注
2文章
361瀏覽量
20868 -
美格智能
+關(guān)注
關(guān)注
2文章
305瀏覽量
12291
發(fā)布評論請先 登錄
AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?
國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?
從 CPU 到 GPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計?
智能安防邊緣計算的技術(shù)解析
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理
美格智能攜手阿加犀,助力維田科技發(fā)布第二代智能植保機(jī)器人
COMPUTEX 2025|從容器化到車規(guī)級安全,美格智能200K DMIPS CPU算力模組打造智能座艙的“超級底座”
搭建算力中心,從了解的GPU 特性開始
6TOPS算力NPU加持!RK3588如何重塑8K顯示的邊緣計算新邊界
超越CPU/GPU:NPU如何讓AI“輕裝上陣”?
RK3588核心板在邊緣AI計算中的顛覆性優(yōu)勢與場景落地
從CPU到GPU:渲染技術(shù)的演進(jìn)和趨勢
云 GPU 加速計算:突破傳統(tǒng)算力瓶頸的利刃
算智算中心的算力如何衡量?

從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)算力計算效能
評論