国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

沐曦助力上海創智學院siiRL 2.0全面升級

沐曦MetaX ? 來源:沐曦MetaX ? 2025-09-29 11:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能加速邁向大模型與智能體時代的今天,強化學習(Reinforcement Learning,RL)已經成為推動智能系統演化的關鍵技術。隨著強化學習訓練規模不斷擴大,對底層算力提出了前所未有的挑戰。近日,上海創智學院 AI Infra 團隊發布的 siiRL 2.0,以其卓越特性為強化學習的發展帶來了新的突破,沐曦則憑借自身優勢為 siiRL 2.0 的升級提供了堅實支撐,共同推動強化學習正式邁入 “千卡級”時代。

siiRL:全分布式架構的顛覆性突破

上海創智學院AI Infra團隊發布siiRL 2.0,聚焦性能、生態與前沿探索全面升級:

卓越性能與擴展性

基于全分布式架構,實現千卡級近線性擴展與業界領先吞吐,性能在7B~235B(Dense/MoE)等大規模模型上穩定驗證。

自主可控,擁抱國產算力

全面適配多家主流國產芯片并完成千卡級擴展驗證,為AI基礎設施夯實自主可控的算力底座。

靈活易用與生態兼容

獨創DAG工作流支持無代碼算法實驗,兼容Megatron/FSDP等主流后端,極大提升研發效率。

面向前沿,支持多智能體研究

內建強大的多智能體協同訓練框架,為探索“智能涌現”等前沿課題提供關鍵基礎設施。

9b4e6c46-9829-11f0-8c8f-92fbcf53809c.png

圖 1:siiRL架構概覽

技術論文:https://arxiv.org/abs/2507.13833

開源代碼倉庫:https://github.com/sii-research/siiRL

在本次siiRL的升級適配工作中,沐曦做了一系列針對性優化:

siiRL框架高效適配

基于沐曦自研的MXMACA軟件棧,已經完整適配了siiRL需要的所有后端引擎(Vllm/Pytorch fsdp/Megatron-LM/Ray)以及深度優化的mccl高性能通信庫,不需要其他額外的適配工作,實現了siiRL框架的高效適配。

超節點scale up

沐曦Dragonfly超節點,提供了64卡的光互連高速通信帶寬。在訓練過程中,通過設置fsdp_size=64,可以充分利用超節點內的帶寬,提升模型的訓練效率。

顯存優化

通過設置模型參數offload選項,在共置集群上,有效降低了rollout和training階段的峰值顯存,可以采用更優的切分方式,進一步提升計算效率。

分布式策略調整

結合實際負載與硬件拓撲,優化了不同模型的分布式訓練參數切分方式,并調整了親和性配置,以提升通信效率。

通過上述優化,siiRL框架在沐曦超節點集群上實現了從64卡到1024卡的穩定擴展,系統保持了超過92%的高線性度拓展效率。在模型精度上,與國際主流生態 GPU的訓練結果相比,沐曦超節點集群在驗證集上的平均絕對誤差控制在0.5%以內,滿足實際應用場景的精度要求。

9bc2af0c-9829-11f0-8c8f-92fbcf53809c.png

圖 2:siiRL在沐曦超節點集群上的擴展性評估,

展示了64卡到1024GPU規模下的高線性擴展能力

隨著 AI 技術逐漸成為國家科技競爭的核心,構建自主可控的算力基礎設施已經成為產業發展的必然選擇。沐曦與上海創智學院 AI Infra 團隊的攜手合作,不僅驗證了國產 GPU 在前沿 AI 應用上的可行性與先進性,更為中國科研機構、產業界提供了面向未來的堅實算力底座。沐曦將持續與產學研伙伴深度協作,推動大模型框架與國產 GPU 的深度適配和生態完善,加速強化學習、大模型、智能體等關鍵領域的創新應用落地。

關于沐曦

沐曦致力于自主研發全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領域提供高能效、高通用性的算力支撐,助力數字經濟發展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135443
  • 沐曦
    +關注

    關注

    1

    文章

    80

    瀏覽量

    1811
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5183

原文標題:強化學習進入“千卡級”時代,沐曦助力 siiRL 2.0 全面升級

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    云C500/C550 GPU產品深度適配MiniMax M2.5模型

    2月13日晚間,MiniMax正式開源MiniMax M2.5模型。技術團隊依托MXMACA軟件棧,在24小時內完成云C500/C550 對該模型的深度適配。
    的頭像 發表于 02-26 14:19 ?637次閱讀

    股份CXO預科班2026冬令營圓滿收官

    2月6日,由集成電路(上海)股份有限公司(股票代碼:688802,簡稱“股份”)主辦、之江實驗室大力支持、
    的頭像 發表于 02-25 16:29 ?1042次閱讀

    云C500/C550 GPU產品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力Padd
    的頭像 發表于 01-30 10:19 ?747次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 GPU產品適配PaddleOCR-VL-1.5模型

    股份與江南大學建立聯合研究中心

    近日,教育部哲學社會科學實驗室“食品安全與國家戰略治理實驗室”揭牌暨合作簽約儀式、學術委員會會議在無錫隆重舉行。活動現場,集成電路(上海)股份有限公司與江南大學簽署共建協議,并同步揭牌“江南大學
    的頭像 發表于 01-21 17:25 ?1370次閱讀

    與Arm、熠知一同到訪清華大學交流座談

    助力頂尖學府清華大學在“AI+教科研”領域取得新突破,培養具備AI創新能力的人才,1月12日,集成電路(上海)股份有限公司(股票代碼:688802)、半導體頭部企業Arm控股有限
    的頭像 發表于 01-14 13:52 ?350次閱讀

    受邀出席第二屆開源產業生態大會

    以“開源筑基·數實維新”為主題的第二屆開源產業生態大會將于1月13日在上海舉行。受邀出席本次行業盛會,聯合創始人、CTO兼首席軟件架構師楊建將發表主題演講并參與圓桌論壇環節,分享
    的頭像 發表于 01-14 13:51 ?299次閱讀

    股份在上海證券交易所科板掛牌上市

    近日,股份正式在上海證券交易所科板掛牌上市,股票代碼:688802.SH。作為國內高性
    的頭像 發表于 12-24 09:03 ?2579次閱讀

    股份云C系列GPU Day 0適配智譜GLM-4.6V多模態大模型

    12月8日智譜AI發布并開源 GLM-4.6V 系列多模態大模型,股份云C系列GPU完成Day 0適配。
    的頭像 發表于 12-17 14:28 ?621次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列GPU Day 0適配智譜GLM-4.6V多模態大模型

    DLInfer聯手股份實現數據生成場景的實際落地

    近期,上海 AI 實驗室 DeepLink 團隊推出的 DLInfer 通過支持 LMDeploy 主流模型推理,助力股份云 C500
    的頭像 發表于 12-09 14:55 ?709次閱讀
    DLInfer聯手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份實現數據生成場景的實際落地

    股份與上海電信完成首期GPU生態專家認證培訓

    近期,集成電路(上海)股份有限公司(以下簡稱“股份”)攜手上海電信天翼云能力運營中心(以
    的頭像 發表于 10-31 10:33 ?491次閱讀

    首款全國產通用GPU芯片發布 集成推出云C600

    ,并支持MetaXLink超節點擴展技術,在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓練和推理需求。 而且,股份與中國科學院合作的國產千卡集群,已完成多個大模型全參數訓練,證實國產算力已具備大模型預訓練能力。 公開資料
    的頭像 發表于 10-19 20:04 ?4.6w次閱讀

    GPU與龍蜥操作系統完成適配

    集成電路(上海)股份有限公司(以下簡稱"")于 2020 年 9 月成立于上海,其擁有技
    的頭像 發表于 10-17 15:06 ?1200次閱讀

    書生大模型實戰營魔樂專場MeetUP精彩回顧

    近日,由書生大模型社區、、魔樂社區、算豐和 DaoCloud 道客等聯合打造的「書生大模型實戰營魔樂專場 MeetUP 暨頒獎儀式」在上海
    的頭像 發表于 08-20 11:33 ?1108次閱讀

    硅基流動攜手首發基于云的Kimi K2推理服務

    今天,硅基流動聯合集成電路(上海)股份有限公司(簡稱“”),全球首發基于
    的頭像 發表于 07-23 17:33 ?1928次閱讀

    PaddleScience完成與AI芯片適配

    當前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計算、科學建模等多個方向。這一趨勢正加速形成面向"Al for Science"的國產智算生態新格局。
    的頭像 發表于 05-06 14:49 ?1639次閱讀