電子發燒友網報道(文/李彎彎)2025年6月6日,面壁智能CEO李大海在北京智源大會上發布有史以來最具想象力的面壁小鋼炮模型MiniCPM4.0,代號“前進四”,開源兩個版本,8B閃電稀疏版和0.5B最強小小鋼炮。

李大海表示,面壁智能是第一個把全模態模型帶到端側的公司。面壁智能小鋼炮,旨在把大模型放到離用戶最近的地方,做高效的端側智能。
MiniCPM4.0最大的特點——快
2019年面壁智能超前入局大模型,發布世界首個知識增強大模型ERNE,2020年發布國內首個中文大模型CPM-1,2021年發布持續學習發模型CPM-2,2022年發布可控生成大模型CPM-3;2023年,面壁智能又發布CPM-Bee多語言百億大模型,之后還發布了第三代千億參數多模態大模型CPM-Cricket,評分超越GPT-3.5,邏輯能力比肩GPT-4。
2024年面壁智能領先走向端側智能。2月發布MiniCPM-2B旗艦級端側模型;4月發布MiniCPM 2.0;9月發布MiniCPM-V 2.6,在端側性能實現全面對標 GPT-4V;12月發布MiniCPM 3.0,在包括自然語言理解、知識、代碼、數學等多項能力上超越OpenAI的 GPT-3.5;2025年1月,面壁智能發布MiniCPM-o 2.6端側全模態模型,性能比肩GPT-4o;2025年3月發布cpmGO,首個純端側智能體助手。

李大海介紹,面壁智能端側大模型面壁小鋼炮包括基座模型MiniCPM、旗艦多模態模型MiniCPM-V、旗艦全模態模型MiniCPM-o。截至目前,面壁小鋼炮旗艦端側大模型有超過1000萬下載量。李大海表示:“這是千千萬萬開發者對我們的認可,未來還會持續發布更好的端側大模型,賦能智能硬件的創新和開發。”

“這次發布的面壁小鋼炮模型MiniCPM4.0版本,最大的特點就是快。”李大海談到,“相比其他模型,MiniCPM4.0-8B僅22%訓練開銷,在同等參數下,性能更強,可對標Qwen3-8B,超越Gemma3-12B。”
MiniCPM4-MCP支持15個主流應用,包括Airbnb、Github mcp、Slack、PPTs、PowerPoint、office-Word-Mcp-Server、Computer Use、Desktop-commander、File_system、OpenAI Whisper等;MiniCPM4-Survey端側版表現比肩DeepResearch。

面壁小鋼炮正在進行廣泛的生態適配,適配主流芯片與開源框架部署,芯片如括華為、英特爾、聯發科、高通;開源框架如LLM、LlamaFactory、AutoGPT、SGland等。李大海強調,依托分塊稀疏注意力機制,MiniCPM4.0在英特爾平臺上推理深度優化實現兩倍加速。
多維度技術創新——架構高效、推理高效
MiniCPM4.0之所以能夠做到又快又好,源于系統級層層效率優化,包括四個層面:架構高效、推理高效、學習高效、數據高效。

架構高效方面,MiniCPM4.0采用InfLLM升級版InfLLM 2.0稀疏注意力結構。李大海介紹說,稀疏度越高,計算量越小,速度越快。傳統Transformer模型每token需和序列中所有token進行相關性計算逐字重復計算,效率低下。InfLLM 稀疏注意力機制,對文本分塊分區域處理,只對最具相關性重點區城進行注意力計算“抽查”,更高效。
而且MiniCPM4.0采用高效雙頻換擋,即長文本用稀疏,短文本用稠密。

推理高效方面,面壁智能自研全套端側高性能推理框架。CPM.cu自研極速端側推理框架,稀疏、投機和量化的高效結合,FR-Spec輕量化投機采樣,并給小模型減負加速,使得速度提升5倍;BitCPM極致低位寬量化,端側極致內存容量友好,4-bit量化達業界SOTA等級,瘦身90%;Arklnfer自研跨平臺部署框架,面向多平臺端側芯片極致優化,跨平臺高效投機采樣和限制解碼,端側多平臺 ModelZoo絲滑使用,速度提升2倍。
李大海表示,與云端不同,云端多采用英偉達、昇騰的芯片,而端側較為復雜,這種跨平臺部署框架對于大模型端側部署來說就極為重要。在他看來,面壁智能新帶來的面壁小鋼炮模型MiniCPM4.0,在多項技術的加持下,使用更少的數據,需要更少的訓練、更少的算力,因而成本也會下降,這有助于大模型能在更多場景實現落地。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
模型
+關注
關注
1文章
3751瀏覽量
52097 -
云模型
+關注
關注
0文章
10瀏覽量
7132
發布評論請先 登錄
相關推薦
熱點推薦
百度蘿卜快跑與Uber進一步深化戰略合作
今天,蘿卜快跑與全球最大的移動出行服務平臺Uber共同宣布,雙方將進一步深化戰略合作,計劃于2026年第一季度在阿聯酋迪拜正式推出全無人駕駛出行服務,這也是迪拜首次迎來全無人駕駛出行服務。
BlackBerry QNX與眾森軟件進一步深化戰略合作
今日,深圳市眾森軟件有限公司(以下簡稱"眾森軟件")正式宣布與全球領先的實時操作系統與嵌入式軟件供應商 QNX(BlackBerry有限公司旗下部門QNX)進一步深化戰略合作。此次合作將進一步推動下一代
上汽奧迪與創維汽車智能合作進一步深化升級
近日,創維汽車智能迎來重要突破:上汽奧迪客戶將當前公司開發的顯示屏項目沿用至上汽奧迪其他主力車型。這一決定不僅體現了客戶對創維汽車智能技術實力與服務品質的高度認可,更標志著雙方合作進一步
廣和通發布端側情感對話大模型FiboEmo-LLM
9月,廣和通正式發布自主研發的端側情感對話大模型FiboEmo-LLM。該模型專注于情感計算與自然語言交互融合,致力于為AI玩具、
蔚來進一步拓展其全球業務
8月18日,蔚來公司宣布將于2025年至2026年期間陸續進入新加坡、烏茲別克斯坦和哥斯達黎加三個市場,進一步拓展其全球業務,為當地用戶帶來創新、可持續、高品質的智能電動出行體驗。
Nordic PMIC全家桶,讓電源管理和節能更進一步!
使用 nPM2100 開始設計和開發應用。此外,nPM2100 評估套件 (EK) 也已全面上市,多家分銷商在發布當天提供庫存套件并進行銷售。
nPM2100 是一款電源管理集成電路 (PMIC),旨在
發表于 06-29 17:19
恩智浦技術賦能下一代家庭能源管理系統
2024年11月發布了Matter 1.4版本,其中一大亮點是它極大地擴展了對家庭能源管理系統 (HEMS) 的支持。Matter 1.3引入了能源報告功能,實現大型家電和供電設備能源管理用例,而Matter 1.4則更進一步,
CoT 數據集如何讓大模型學會一步一步思考?
目前,大模型的回答路徑基本遵循 input-output 的方式,在面對復雜任務時表現不佳。反之,人類會遵循一套有條理的思維流程,逐步推理得出正確答案。這種差異促使人們深入思考:如何才能讓大模型“
英特爾與面壁智能宣布建立戰略合作伙伴關系,共同研發端側原生智能座艙,定義下一代車載AI
今日,英特爾與面壁智能簽署合作備忘錄。雙方宣布達成戰略級合作伙伴關系,旨在打造端側原生智能座艙,定義下一代車載AI。目前,雙方已合作推出“英
誠邁科技、智達誠遠隆重推出ArraymoAIOS 2.0 端側AI操作系統,開啟智能體協作新時代
隨著生成式AI技術的日益成熟,目前大模型正在從云側向端云協同遷移。2025年,AI進一步加速向終端側下沉,AI大模型將直接部署在各類終端設備
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
AI巨頭強強聯手,勢必為智能體化AI體驗時代按下超級加速鍵。
AI終端的下一步是“普適智能”,而不是“極限性能”。聯發科憑借天璣9400+強悍的端
發表于 04-13 19:52
面壁小鋼炮模型MiniCPM4.0發布,端側智能更進一步
評論