正文
近日,深圳市半導(dǎo)體與集成電路產(chǎn)業(yè)聯(lián)盟和與非網(wǎng)聯(lián)合主辦的“AI芯片與智算產(chǎn)業(yè)發(fā)展高峰論壇”和“云邊無界AI技術(shù)分論壇”,在深圳會展中心(福田)隆重舉行。會上,《2025年度國產(chǎn)AI芯片產(chǎn)業(yè)白皮書》正式發(fā)布,該白皮書全面梳理了國產(chǎn)AI芯片的技術(shù)演進(jìn)、產(chǎn)業(yè)格局、落地挑戰(zhàn)與未來趨勢,為從業(yè)者提供前沿洞察與決策參考,愛芯元智作為重點(diǎn)企業(yè)入選。同期,愛芯元智AI推理引擎技術(shù)總監(jiān)唐琦受邀發(fā)表《AI原生處理器:讓大模型在終端跑起來》主題演講,分享邊端大模型趨勢與愛芯元智的創(chuàng)新解決方案。
2025年邊端大模型迎來爆發(fā)式增長,幾乎每月都有新模型發(fā)布,從1月的DeepSeek,到2月的FireRedLLM、CosyVoice2,4月的Qwen3、SmolVLM2,5月的Qwen2.5-VL,6月的MiniCPM4,7月的SmolLM3,8月的InternVL3.5,再到9月的VoxCPM,模型迭代速度持續(xù)加快。
在這一背景下,NVR智能升級、NAS智能改造、離線實(shí)時翻譯、語音克隆、家庭智能中樞、智能駕艙環(huán)境感知、具身智能機(jī)器人等行業(yè)場景,均提出對多模態(tài)大模型本地離線運(yùn)行的強(qiáng)烈需求,推動算法精度與用戶體驗(yàn)不斷提升。
愛芯M.2算力卡:即插即用,高效賦能邊端AI
面對邊端大模型部署中“更換主控成本高、帶寬占用大、影響核心業(yè)務(wù)穩(wěn)定性”等痛點(diǎn),愛芯元智推出基于AX8850的M.2 2242/2280標(biāo)準(zhǔn)接口算力卡,功耗<8w,以“即插即用”的方式為現(xiàn)有設(shè)備提供高效算力擴(kuò)容。該方案支持從M.2卡擴(kuò)展為PCIE卡,升級改造簡便,顯著降低部署門檻。
目前,該算力卡已適配樹莓派5、RK3588、Intel工控機(jī)等多種硬件平臺,并配套推出MaixCAM-HAT、AX-M1、LLM8850等社區(qū)板卡,具備體積小、性能強(qiáng)、功耗低、性價比高等綜合優(yōu)勢。
在核心芯片層面,愛芯元智推出搭載自研“愛芯通元AI處理器”的“愛芯元曦”系列AI芯片,專為邊緣與端側(cè)AI場景設(shè)計。該芯片采用“算子指令集+數(shù)據(jù)流DSA微架構(gòu)”雙核心理念,在性能、功耗與面積之間實(shí)現(xiàn)極致平衡。
其算子指令集支持包括Conv、Transformer、LSTM等在內(nèi)的超百種AI算子,覆蓋圖像、視頻、文本及多模態(tài)任務(wù),并原生適配DeepSeek、Qwen、Llama等主流大模型架構(gòu)。異構(gòu)多核架構(gòu)集成高效張量核、靈活向量核與高帶寬數(shù)據(jù)引擎,支持4bit至32bit混合精度計算。配合高性能硬件多核調(diào)度器,可優(yōu)化數(shù)據(jù)依賴,顯著提升算力利用效率。成熟工具鏈生態(tài)提供從模型量化、編譯優(yōu)化到部署上線的全流程支持,兼容PyTorch、TensorFlow、ONNX等主流框架,大幅提升開發(fā)效率。
目前,愛芯元智AI處理器已完成高、中、低全算力布局并實(shí)現(xiàn)規(guī)模化量產(chǎn),其能效比較傳統(tǒng)GPGPU提升一個數(shù)量級,在以文搜圖、通用檢測、以圖生文、AI Agent等應(yīng)用中,為客戶提供更具“智價比”的邊端算力基建。
基于M.2算力卡與AI原生處理器,愛芯元智已在多個場景實(shí)現(xiàn)技術(shù)落地,包括NVR智能升級中的文搜大模型與Frigate NVR、NAS智能升級中的Immich智能相冊,以及視頻分析、StableDiffusion圖像生成、視頻超分與插幀、會議轉(zhuǎn)錄、語音克隆等豐富示例,展現(xiàn)出廣泛的產(chǎn)品適用性與開源生態(tài)活力。
愛芯元智將持續(xù)以AI原生處理器與靈活算力解決方案,推動大模型在邊端側(cè)的高效、經(jīng)濟(jì)、環(huán)保部署,構(gòu)建邊端智能共同體,實(shí)現(xiàn)“普惠AI 造就美好生活”的使命。
-
處理器
+關(guān)注
關(guān)注
68文章
20255瀏覽量
252265 -
AI芯片
+關(guān)注
關(guān)注
17文章
2128瀏覽量
36774 -
愛芯元智
+關(guān)注
關(guān)注
1文章
128瀏覽量
5512
原文標(biāo)題:《2025年度國產(chǎn)AI芯片產(chǎn)業(yè)白皮書》發(fā)布,愛芯元智M.2算力卡加速邊端大模型落地
文章出處:【微信號:愛芯元智AXERA,微信公眾號:愛芯元智AXERA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
墨芯人工智能千卡集群正式簽約入駐新疆算力中心
邁向云端算力巔峰:昆侖芯K200 AI加速卡全面解讀
愛芯元智亮相2025中國國際半導(dǎo)體博覽會
愛芯元智邊緣AI芯片AX8850完成Qwen3-VL多模態(tài)大模型適配
愛芯元智攜手合作伙伴M5Stack亮相YOLO Vision 2025
愛芯元智亮相2025全球AI芯片峰會
此芯科技發(fā)布“合一”AI加速計劃,賦能邊緣與端側(cè)AI創(chuàng)新
愛芯元智攜手靈境聲學(xué)推出“愛芯元聲”音頻解決方案
存算一體技術(shù)加持!后摩智能 160TOPS 端邊大模型AI芯片正式發(fā)布
后摩智能發(fā)布全新端邊大模型AI芯片
新品上線|Maix4-HAT 大模型 AI 加速套件 ,一鍵解鎖樹莓派多模態(tài) AI 力量!
高速互聯(lián)時代,如何精準(zhǔn)測試PCIe M.2接口?
如何精準(zhǔn)測試PCIe M.2接口
智算加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!
愛芯元智M.2算力卡加速邊端大模型落地
評論