国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

眾智FlagOS適配面壁智能開源全模態大模型MiniCPM-o 4.5

perfxlab ? 來源:perfxlab ? 2026-02-09 14:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2月3日,面壁智能正式發布并開源了集語言、視覺、語音于一體的全模態大模型 MiniCPM-o 4.5。作為首個全雙工全模態大模型,MiniCPM-o 4.5 首次實現“類人”感知交互,從“一問一答”變為“即時自由對話”。

眾智 FlagOS 社區跟面壁智能深度技術協同,通過統一開源的 AI 系統軟件棧 FlagOS 的跨芯片能力,快速實現了 MiniCPM-o 4.5 模型在 6 家主流硬件平臺(天數智芯、華為昇騰、平頭哥、海光、沐曦等)適配、對齊評測和開源上線。澎峰科技作為社區成員積極參與了vLLM-plugin-FL等關鍵組件的構建與優化工作。在保證模型精度完全一致的前提下,基于 FlagOS 版本的 MiniCPM-o 4.5 在 6 種芯片上均獲得端到端推理性能提升(硬件一致下,FlagOS 版本相比 CUDA 版本提升端到端推理效率 6.10%),不同場景下平均加速比為7.76%—22.4%。這是業界首次實現 “跨芯適配規?;?、推理效率高效化”雙重目標的典范,為多元 AI 芯片生態下的模型部署樹立全新標桿。

5c383780-0269-11f1-90a1-92fbcf53809c.png

FlagOS:面向多種 AI 芯片的系統軟件棧

FlagOS Inside:

實現 MiniCPM-o 4.5 在多家芯片的快速適配

MiniCPM-o 4.5 能在較短時間被適配到 6 種不同 AI 芯片,得益于眾智 FlagOS 的多芯片統一 AI 系統軟件棧能力。

統一多芯片接入插件 vLLM-plugin-FL:在不改變 vLLM 原有接口和使用習慣的情況下,絲滑實現 MiniCPM-o 4.5 的多芯片推理部署。

高性能算子庫FlagGems:全覆蓋 MiniCPM-o 4.5 的主流 PyTorch Aten 算子,并支持多種 AI 芯片。

統一 AI 編譯器FlagTree:將 MiniCPM-o 4.5 主流算子編譯成 6 種 AI 芯片后端理解的硬件指令。

vllm-plugin-FL 是一個為 vLLM 推理/服務框架構建的插件,它基于 FlagOS 的統一多芯片后端開發,旨在擴展 vLLM 在多種硬件環境下的功能和性能表現。此次,面壁智能一共發布了2個推理引擎版本的 MiniCPM-o 4.5 模型,分別是 Transformer 和 vLLM。使用 vLLM 推理引擎的 MiniCPM-o 4.5 模型中,vLLM-plugin-FL 基于 Python 的 EntryPoint 機制把 MiniCPM-o 4.5 模型結構注冊到 vLLM 支持的模型中,利用統一多芯片高性能算子庫 FlagGems 和統一多后端通信庫 FlagCX,實現同一套代碼流程多芯片執行 MiniCPM-o 4.5。

在代碼實現層面,眾智 FlagOS 將 FlagGems 算子庫及其運行依賴的編譯器 FlagTree 前置性內置,并集成到MiniCPM-o 4.5 的模型代碼框架。開發者在使用 MiniCPM-o 4.5 時,無需手動添加任何啟用 FlagOS 的初始化代碼,就能實現對核心計算模塊(如 RMSNorm等)的無縫替換。這意味著,使用者在加載官方模型時,FlagOS 系統軟件棧代碼已在底層自動生效,真正做到 “開箱即用” 。

開發者無需關心底層硬件適配與算子優化的復雜細節,只需正常調用模型,即可在保持精度完全一致的同時,獲得端到端推理的性能提升。為開發者提供了更流暢、更高效的模型部署體驗。


FlagOS 軟件代碼內置于 MiniCPM-o 4.5 模型框架:

Python
importtorch
importflag_gems
importtorch.nnasnn
fromflag_gems.experimental_opsimportrmsnormasgems_rmsnorm




classGemsRMSNorm(nn.Module):
 def__init__(self, hidden_size, eps=1e-6):
super().__init__()
   self.weight = nn.Parameter(torch.ones(hidden_size))
   self.variance_epsilon = eps
 
 defforward(self, hidden_states):
returngems_rmsnorm(hidden_states,self.weight,self.variance_epsilon)
 
 
 defextra_repr(self):
returnf"{tuple(self.weight.shape)}, eps={self.variance_epsilon}"




fromtransformers.models.qwen3importmodeling_qwen3
fromtransformers.models.llamaimportmodeling_llama
modeling_qwen3.Qwen3RMSNorm = GemsRMSNorm
modeling_llama.LlamaRMSNorm = GemsRMSNorm




flag_gems.only_enable(record=True, once=True, path="/root/gems.txt", include=["cumsum","gather","scatter","clamp"])

基于 FlagOS 跨平臺能力,MiniCPM-o 4.5 實現在 6 家硬件平臺的兼容適配,涵蓋 NPU、GPGPU、DSA等多種芯片架構。FlagOS 作為開源、統一的 AI 系統技術棧,能夠高效解決大模型因硬件生態碎片化導致的“跨平臺兼容難”行業難題,展示出加速模型“一次開發,多芯使用”的巨大潛力。

針對不同硬件平臺優化后的 MiniCPM-o 4.5 模型,眾智 FlagOS 社區已通過FlagRelease項目在 HuggingFace、魔搭社區、魔樂社區等主流開源社區平臺發布(后續將陸續上線阿里云、騰訊云、煥新平臺等平臺)。

隨著芯片硬件的持續適配,FlagOS 將加速大模型獲得更廣泛的硬件支持,幫助用戶實現更低的成本、更靈活的硬件選型方案。

通過 vLLM-plugin-FL 直接使用多芯版 MiniCPM-o 4.5 模型(vLLM 推理引擎)

利用 vLLM-plugin-FL 啟動 MiniCPM-o 4.5 模型的部署步驟可以參考以下一站式文檔。當前 vLLM-plugin-FL已經在英偉達、華為昇騰和平頭哥真武810E進行驗證。

gitcode:https://gitcode.com/flagos-ai/vllm-plugin-FL/blob/main/examples/minicpm/README.md

github:https://github.com/flagos-ai/vllm-plugin-FL/blob/main/examples/minicpm/README.md

為解決芯片硬件生態割裂、模型遷移效率不足和大模型應用落地難等行業痛點,面向多種 AI 芯片的統一、開源系統軟件棧 “眾智 FlagOS” 形成了具備高性能通用 AI 算子庫FlagGems/FlagAttention、統一 AI 編譯器 FlagTree、大模型訓推一體框架 FlagScale 和統一通信庫 FlagCX 的完整核心技術庫,并基于 4 個核心技術庫搭建面向開發者用戶的一站式工具平臺 KernelGen、FlagRelease 和 FlagPerf。為推動 AI 系統軟件邁入“一次開發、跨芯片運行、多框架支持”的新階段,眾智 FlagOS 進一步加強技術創新,加快生態使能 vllm-plugin-FL、Megatron-LM-FL 和 TransformerEngine-FL 的建設,逐步整合算力與開源生態,加速 AI 從實驗室走向規?;瘧?。

關于眾智 FlagOS 社區

為解決不同 AI 芯片大規模落地應用,北京智源研究院聯合眾多科研機構、芯片企業、系統廠商、算法和軟件相關單位等國內外機構共同發起并創立了眾智 FlagOS 社區。成員單位包括北京智源研究院、中科院計算所、中科加禾、安謀科技、北京大學、北京師范大學、百度飛槳、硅基流動、寒武紀、海光信息、華為、基流科技、摩爾線程、沐曦科技、澎峰科技、清微智能、天數智芯、先進編譯實驗室、移動研究院、中國礦業大學(北京)等多家在 FlagOS 軟件棧研發中做出卓越貢獻的單位。

FlagOS 是一款專為異構 AI 芯片打造的開源、統一系統軟件棧,支持 AI 模型一次開發即可無縫移植至各類硬件平臺,大幅降低遷移與適配成本。它包括大型算子庫、統一AI編譯器、并行訓推框架、統一通信庫等核心開源項目,致力于構建「模型-系統-芯片」三層貫通的開放技術生態,通過“一次開發跨芯遷移”釋放硬件計算潛力,打破不同芯片軟件棧之間生態隔離。

未來,澎峰科技將持續投入,積極參與并推動更多開源及商業模型基于FlagOS的適配與性能優化工作。我們堅信,開源協作是構建繁榮、高效算力生態的核心。澎峰科技期待與所有社區伙伴及產業同仁繼續并肩,將FlagOS打造為支撐AI創新的堅實底座,共同推動多元算力生態走向深度融合與開放共贏。

官網:https://flagos.io

GitHub 項目地址:https://github.com/flagos-ai

GitCode 項目地址:https://gitcode.com/flagos-ai

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301359
  • AI芯片
    +關注

    關注

    17

    文章

    2126

    瀏覽量

    36770
  • 大模型
    +關注

    關注

    2

    文章

    3648

    瀏覽量

    5179

原文標題:業界首次!眾智FlagOS實現面壁新模型MiniCPM-o 4.5 “發布即6芯適配”,性能普遍超過原生

文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華為昇騰深度適配智譜AI全新開源模型GLM-5

    ,在真實編程場景的使用體驗逼近Claude Opus 4.5,更擅長復雜系統工程與長程Agent任務。昇騰一直同步支持智譜GLM系列模型,此次GLM-5模型一經開源發布,昇騰AI基礎軟
    的頭像 發表于 02-25 14:41 ?674次閱讀
    華為昇騰深度<b class='flag-5'>適配</b>智譜AI全新<b class='flag-5'>開源</b><b class='flag-5'>模型</b>GLM-5

    瑞芯微RK182X全面適配主流多模態模型

    在全球端側人工智能加速滲透的今天, “生態適配廣度”與“場景落地深度”正成為衡量端側AI平臺核心價值的新標尺。瑞芯微基于全球首顆3D創新架構的AI協處理器RK182X進行生態布局,全面適配包括視覺
    的頭像 發表于 01-27 16:16 ?772次閱讀

    沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態模型

    12月8日智譜AI發布并開源 GLM-4.6V 系列多模態模型,沐曦股份曦云C系列GPU完成Day 0適配。
    的頭像 發表于 12-17 14:28 ?617次閱讀
    沐曦股份曦云C系列GPU Day 0<b class='flag-5'>適配</b>智譜GLM-4.6V多<b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>

    商湯科技正式發布并開源全新多模態模型架構NEO

    商湯科技正式發布并開源了與南洋理工大學S-Lab合作研發的全新多模態模型架構 —— NEO,為日日新SenseNova 多模態模型奠定了新一
    的頭像 發表于 12-08 11:19 ?1014次閱讀
    商湯科技正式發布并<b class='flag-5'>開源</b>全新多<b class='flag-5'>模態</b><b class='flag-5'>模型</b>架構NEO

    寒武紀產品與眾智FlagOS全面適配

    模型的快速發展正推動AI算力需求進入爆發式增長階段。與此同時,不同應用場景又對AI芯片提出了多樣化的挑戰:例如在大模型Prefill場景,對算力要求更高,對內存帶寬的要求則遠低于Decode場景;大模型訓練場景則不僅需要高算力
    的頭像 發表于 11-17 09:16 ?1066次閱讀
    寒武紀產品與<b class='flag-5'>眾智</b><b class='flag-5'>FlagOS</b>全面<b class='flag-5'>適配</b>

    新一代AtomGit平臺暨人工智能開源社區發布

    10月28日,“共建·共智·共享——AtomGit全新升級暨人工智能開源社區發布會”在北京國家會議中心隆重舉行。開放原子開源基金會攜手CSDN等生態伙伴,推動平臺深度融合與能力升級,聚合開源
    的頭像 發表于 10-30 09:46 ?621次閱讀

    硬件與應用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發布新一代混元開源大語言模型。英特爾憑借在人工智能領域的棧技術布局,現已在英特爾? 酷睿? Ultra 平臺上完成針對該模型
    的頭像 發表于 08-07 14:42 ?1365次閱讀
    硬件與應用同頻共振,英特爾Day 0<b class='flag-5'>適配</b>騰訊<b class='flag-5'>開源</b>混元大<b class='flag-5'>模型</b>

    中興努比亞啟動接入百度文心4.5系列開源模型

    近日,中興努比亞啟動接入文心4.5系列開源模型,為星云智能提供新引擎,共同推動人工智能在AI手機的創新應用,加速AI技術落地,進一步提升用
    的頭像 發表于 07-15 09:35 ?1046次閱讀

    面壁小鋼炮模型MiniCPM4.0發布,端側智能更進一步

    版和0.5B最強小小鋼炮。 ? ? 李大海表示,面壁智能是第一個把模態模型帶到端側的公司。面壁
    的頭像 發表于 06-08 08:18 ?7131次閱讀
    <b class='flag-5'>面壁</b>小鋼炮<b class='flag-5'>模型</b><b class='flag-5'>MiniCPM</b>4.0發布,端側<b class='flag-5'>智能</b>更進一步

    德賽西威與面壁智能發布端側大模型語音交互方案

    日前,全球領先的移動出行科技公司德賽西威與端側大模型技術領軍企業面壁智能共同發布業界首個基于高通座艙平臺(SA8255P,簡稱8255)的端側大模型語音交互方案,這是雙方自2024年1
    的頭像 發表于 05-14 17:40 ?1289次閱讀

    愛芯通元NPU適配Qwen2.5-VL-3B視覺多模態模型

    熟悉愛芯通元NPU的網友很清楚,從去年開始我們在端側多模態模型適配上一直處于主動緊跟的節奏。先后適配了國內最早開源的多
    的頭像 發表于 04-21 10:56 ?3145次閱讀
    愛芯通元NPU<b class='flag-5'>適配</b>Qwen2.5-VL-3B視覺多<b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    AI巨頭強強聯手,勢必為智能體化AI體驗時代按下超級加速鍵。 AI終端的下一步是“普適智能”,而不是“極限性能”。聯發科憑借天璣9400+強悍的端側AI能力,加上從模型適配到應用落地的
    發表于 04-13 19:52

    移遠通信智能模組全面接入多模態AI大模型,重塑智能交互新體驗

    智能模組產品已全面接入火山引擎豆包VLM(視覺語言)多模態AI大模型。這一突破性進展表明,搭載移遠任意智能模組的終端設備,均可無縫融合多
    發表于 03-21 14:12 ?532次閱讀
    移遠通信<b class='flag-5'>智能</b>模組全面接入多<b class='flag-5'>模態</b>AI大<b class='flag-5'>模型</b>,重塑<b class='flag-5'>智能</b>交互新體驗

    移遠通信智能模組全面接入多模態AI大模型,重塑智能交互新體驗

    隨著千行百業數智化進程的不斷加速,多模態AI大模型的應用需求不斷攀升,圖像、語音、視頻等多樣化的交互方式正逐漸成為推動行業變革的新動力。3月20日,全球物聯網整體解決方案供應商移遠通信宣布,其
    的頭像 發表于 03-20 19:03 ?819次閱讀
    移遠通信<b class='flag-5'>智能</b>模組全面接入多<b class='flag-5'>模態</b>AI大<b class='flag-5'>模型</b>,重塑<b class='flag-5'>智能</b>交互新體驗

    百度發布文心大模型4.5和文心大模型X1

    文心大模型4.5是百度自主研發的新一代原生多模態基礎大模型,通過多個模態聯合建模實現協同優化,多模態
    的頭像 發表于 03-18 16:29 ?897次閱讀