伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

0.7元/百萬token碾壓競品! 小米新開源大模型,卷出AI普惠關鍵密碼

章鷹觀察 ? 來源:電子發燒友網 ? 作者:章鷹 ? 2025-12-21 07:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(電子發燒友網報道 文/ 章鷹)12月17日,2025小米人車家全生態合作伙伴大會舉行,小米MiMo大模型負責人羅福莉首次登場,她解讀小米最新開源大模型MiMo-V2-Flash,拋出“全球開源模型Top2”“推理成本僅為標桿模型2.5%”等重磅信息。

wKgZO2lFIKmAfaFdAAa2E25RUaY801.png

截至2025年12月19日,小米發布的 MiMo-V2-Flash、深度求索(DeepSeek)的 DeepSeek-V3.2,以及阿里巴巴的 Qwen-3均為當前國產大模型中的代表性產品。在與DeepSeek V3.2、千問Qwen-3對比當中,小米開源大模型到底有哪些優勢和應用價值?本文進行詳細分析。

全球開源模型Top2,主打超絕性價比

MiMo-V2-Flash是小米全新一代面向Agent的基座模型,總參數309B,激活參數15B,支持256k上下文窗口,整體針對推理、編碼和Agent場景構建,支持混合思維模式,允許用戶切換“思考”和即時回答模式。

目前,MiMo-V2-Flash推理吞吐速度為每秒150個token,成本定價0.7元/每百萬輸入token,2.1元/每百萬輸出token,主打超絕性價比。

在架構設計上,小米MiMo-V2-Flash采用了混合注意力機制。其混合模塊設計包含8個混合塊,其中每5個滑動窗口注意力(SWA)層對應1個全局注意力層。在上下文支持能力上,該模型原生支持32K的訓練,并且能夠擴展到256K的上下文支持。

從性能表現來看,小米MiMo-V2-Flash在通用基準測試中,與DeepSeek-V3.2不相上下,同時延遲大幅降低。在SWE-Bench驗證和多語言集中分別取得了73.4%和71.7%的成績。尤為突出的是其速度優勢,在Day-0時,輸出速度高達每秒150個token,這一速度在同類模型中處于領先地位。

圖來自小米官方微信

在多個Agent測評基準上,MiMo-V2-Flash進入全球開源模型Top 2;編碼能力超過所有開源模型,比肩標桿閉源模型Claude 4.5 Sonnet,但推理成本僅為其2.5%,生成速度提升2倍。

小米MiMo-V2-Flash推理效率高,來源兩大創新

羅福莉指出,我們要圍繞極致的推理效率去重新設計模型結構。模型結構主要源自兩大創新:一、模型注意力機制采用了Hybrid Sliding Window Attention(Hybrid SWA/混合滑動窗口注意力機制),其中SWA與Full Attention(全局注意力機制)的比例是5:1,滑動窗口只看 128 個 token。相較于一些復雜的Linear Attention(線性注意力機制),SWA在兼顧長短文的推理、知識檢索等方面更勝一籌。

二是在于MTP(Multi-Token Prediction)。羅福莉表示,團隊在訓練時加入了一層MTP層以提高基座模型能力,并在微調時也加入了更多MTP層,最終在推理時加入了3層MTP,以加速并行token驗證的方式實現了2-2.6倍推理速度的提升。

還有,為了提高強化學習訓練的穩定性,MiMo團隊提出了一種叫做Multi-Teacher On-Policy Distillation(MOPD)的后訓練范式。相較于傳統SFT+RL(微調+強化學習)的后訓練方式,它可以提供稠密的token level監督學習信號,以簡單快速的方式獲得各個專家模型的能力。

此外,小米并推出線上AI聊天服務“Xiaomi MiMO Studio”,用戶可在其中體驗“MiMo-V2-Flash”。

羅福莉在社交平臺上透露了更多信息,MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖上的第二步。

小米發布MiMo-V2-Flash,不僅僅是一次大模型領域的技術創新,更是其“人車家全生態”戰略的關鍵支點。該模型通過多項架構創新與成本優化,為 AI智能體(AI Agent)在終端設備上的落地提供了前所未有的賦能能力。

我們認為,MiMo-V2-Flash 不只是“一個更快的大模型”,而是小米打造 “終端原生智能體操作系統” 的基石。它有機會讓每一臺小米設備都可能成為一個 有記憶、會思考、能行動的智能體節點,最終助力實現雷軍所說的“AI for All Devices, All the Time”。

本文由電子發燒友原創,轉載請注明以上來源。微信號zy1052625525。需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱zhangying@huaqiu.com。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 小米
    +關注

    關注

    70

    文章

    14538

    瀏覽量

    152318
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA推出代理式AI藍圖與電信推理模型

    借助全新開源大型電信模型與 NVIDIA Blueprint,電信運營商能夠利用自有數據訓練 AI 智能體,構建自主網絡。
    的頭像 發表于 03-06 17:37 ?2884次閱讀

    數字電力帝國崛起:Token成為中國能源出口新載體

    成本碾壓下的突圍:Token出海改寫全球AI服務格局
    的頭像 發表于 03-06 16:30 ?1158次閱讀
    數字電力帝國崛起:<b class='flag-5'>Token</b>成為中國能源出口新載體

    OrangePi RV2 深度技術評測:RISC-V AI融合架構的先行者

    推薦場景 RISC-V 架構研究與教學 :學習RISC-V 指令集、操作系統移植、編譯器開發 輕量級AI 原型驗證 :在端側運行小模型(如關鍵詞喚醒、簡單圖像分類) NAS/軟路由 :利用雙M.2 插槽
    發表于 03-03 20:19

    華為昇騰深度適配智譜AI新開源模型GLM-5

    2026年2月12日,智譜AI發布Agentic Engineering時代最好的開源模型GLM-5,從“寫代碼”到“寫工程”的能力進一步演進。在Coding與Agent能力上取得開源
    的頭像 發表于 02-25 14:41 ?918次閱讀
    華為昇騰深度適配智譜<b class='flag-5'>AI</b>全<b class='flag-5'>新開源</b><b class='flag-5'>模型</b>GLM-5

    使用NORDIC AI的好處

    CPU 快 15× 能效最高可比最近的 NPU 好 8×,推理速度快 7×。[Axon NPU 技術頁] 開發門檻低、工具鏈完整 Nordic Edge AI Lab :只需準備好數據集,無需
    發表于 01-31 23:16

    月之暗面全新開源旗艦模型Kimi K2.5上線模力方舟

    模力方舟平臺現已上線來自月之暗面(Moonshot AI)發布的全新開源旗艦模型Kimi K2.5。
    的頭像 發表于 01-29 10:20 ?956次閱讀
    月之暗面全<b class='flag-5'>新開源</b>旗艦<b class='flag-5'>模型</b>Kimi K2.5上線模力方舟

    今日看點:小米正式發布并開源模型 MiMo-V2-Flash;磷酸鐵鋰開啟漲價潮

    小米正式發布并開源模型 MiMo-V2-Flash 近日小米正式發布并開源模型 MiMo-V
    的頭像 發表于 12-17 09:42 ?4338次閱讀

    NVIDIA推出面向語言、機器人和生物學的全新開源AI技術

    NVIDIA 秉持對開源的長期承諾,推出了面向語言、機器人和生物學的全新開源 AI 技術,為構建開源生態系統做出貢獻,擴展 AI 的普及并推
    的頭像 發表于 11-06 11:49 ?1117次閱讀

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機上的原生適配與優化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企業級 A
    的頭像 發表于 08-14 11:34 ?1438次閱讀

    Arm率先適配騰訊混開源模型,助力端側AI新開

    本周初,騰訊混宣布開源四款小尺寸模型(參數分別為 0.5B、1.8B、4B、7B),可無縫運行于消費級顯卡上。作為全球應用范圍最為廣泛的計算平臺,Arm 在開源首日就已率先實現適配,
    的頭像 發表于 08-08 09:16 ?1425次閱讀
    Arm率先適配騰訊混<b class='flag-5'>元</b><b class='flag-5'>開源</b><b class='flag-5'>模型</b>,助力端側<b class='flag-5'>AI</b>創<b class='flag-5'>新開</b>發

    中興通訊加速算力AI應用普及

    網絡連接和智能算力的領導者” 的戰略愿景,全面投入AI,加速AI和ICT的融合,以AI技術賦能實體經濟,加速算力
    的頭像 發表于 05-06 14:10 ?1020次閱讀

    華為助力醫療行業智慧化轉型

    當今世界,全球AI模型數量高速增長,隨著DeepSeek工程技術創新帶來的效率大幅提升,訓練成本下降至1/10,每百萬token單價降幅超過99%,同時大
    的頭像 發表于 04-28 10:07 ?927次閱讀
    華為助力醫療行業智慧化轉型

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    AI的演進正在逼近“終端智能涌現”的拐點,從通用模型向場景落地遷移成為關鍵議題。聯發科以“AI隨芯,應用無界”為主題召開天璣開發者大會2025(MDDC 2025),不僅聚合了全球生態
    發表于 04-13 19:52

    聯想集團領跑AI新時代

    近日,以“混合式AI 創新向未來”為主題的聯想集團2025/26財年誓師大會在北京國家網球中心舉行。大會現場,聯想集團執行副總裁兼中國區總裁劉軍發表《人智共創 領跑AI新時代》主題
    的頭像 發表于 04-02 16:14 ?938次閱讀

    華為全光網加速AI千行萬業

    近日,在“華為中國合作伙伴大會2025”期間,華為光產品線總裁陳幫華發表了“無光不AI,全光網加速AI千行萬業”主題演講。他表示,各行各業都在積極擁抱
    的頭像 發表于 04-01 15:32 ?1093次閱讀