伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種基于分布式光交換的高帶寬域架構InfiniteHBD

曦智科技 ? 來源:曦智科技 ? 2025-06-09 10:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

曦智科技聯合北京大學、階躍星辰為下一代萬億參數大模型訓練的基礎設施建設提出全新解決方案。

隨著大模型參數規模的擴大,分布式訓練成為人工智能發展的核心途徑。分布式訓練可以將模型數據分配給多個計算節點,進行并行計算和數據管理,從而顯著加速模型訓練的過程,而高帶寬域(High Bandwidht Domain, HBD)的設計對提升模型算力利用率至關重要。

然而,現有的HBD架構在可擴展性、成本和容錯能力等方面存在根本性限制:

交換機中心的HBD(如NVIDIA NVL72)成本高昂、不易擴展規模。

以以AI 加速器(包括GPU 與專用ASIC)為中心的HBD(如Google TPUv3和Tesla Dojo)存在嚴重的故障傳播問題。

2022 年Google發布TPU v4 集群,首次采用光交換方案(Optical Circuit Switch,以下簡稱“OCS”),這種交換機-GPU混合的HBD在互連成本與系統擴展性之間采取了折中方案,但仍存在故障爆炸半徑問題,其成本和容錯能力仍不甚理想。

70f2da02-41b9-11f0-b715-92fbcf53809c.jpg

在此背景下,曦智科技聯手北京大學、階躍星辰的研究團隊提出了一種以光交換(OCS)模組為中心的高帶寬域架構InfiniteHBD,通過在光電轉換模組中集成OCS能力,InfiniteHBD實現了動態可重構的單點對多點連接,具備節點級故障隔離和低資源碎片化的能力。

InfiniteHBD在可擴展性和成本上全面優于現有方案:InfiniteHBD的單位成本僅為NVL72的31%,GPU冗余率比NVL72和TPUv4低一個數量級,且與NVIDIA DGX(單機8卡)相比,模型算力利用率最高提升3.37 倍。

該方案以論文形式被國際通信網絡領域頂級會議SIGCOMM 2025[1]接收。

曦智科技在集成硅光領域擁有十余年的產業經驗,在InfiniteHBD 方案中,創新性的開發了基于硅光子技術的分布式光交換dOCS(distributed Optical Circuit Switch),將基于馬赫曾德(MZI,Mach-Zehnder Interferometer)交換矩陣的光交換芯片集成到商用QSFP-DD 800Gbps光電轉換模組中,大幅簡化了器件結構的同時,有效提升了器件集成度,從而降低了成本和功耗,顯著提升了InfiniteHBD 的性價比和系統可擴展性。

715fa696-41b9-11f0-b715-92fbcf53809c.png

分布式光交換方案對于建設超大規模訓練集群具有以下收益:

dOCS自帶光電轉換,提供交換能力的同時可形成跨機超節點;

光交換芯片采用成熟制程,降低了對于先進制程電交換芯片的依賴;

光交換芯片對協議不敏感,適用于當前GPU連接協議碎片化的現狀

InfiniteHBD為高帶寬域架構的高效擴展提供了新的解決方案,為下一代萬億參數大模型訓練的基礎設施建設帶來了重要啟示。 注釋: [1]SIGCOMM,Special Interest Group on Data Communication,即數據通信專業組,是ACM(美國計算機協會)組織在通信網絡領域的旗艦會議。今年的SIGCOMM 將于9 月8日-11日在葡萄牙科英布拉舉行。

關于曦智科技

曦智科技是全球領先的光電混合算力提供商。公司憑借在集成光子領域的開創性技術和全球頂尖的集成電路技術研發團隊,致力于在計算需求爆發的時代,為客戶提供一系列算力躍遷解決方案,與客戶共建更智能、更可持續的世界。曦智科技從光子矩陣計算(oMAC)、片上光網絡(oNOC)和片間光網絡(oNET)三大核心技術出發,打造光子計算和光子網絡兩大產品線,與大數據、云計算、金融、自動駕駛、生物醫藥、材料研究等領域客戶開展緊密合作,持續為客戶提供更具創造性的高效算力支撐。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    841

    瀏覽量

    40213
  • 算力
    +關注

    關注

    2

    文章

    1634

    瀏覽量

    16824
  • 大模型
    +關注

    關注

    2

    文章

    3731

    瀏覽量

    5262

原文標題:曦科技|基于分布式光交換高帶寬域InfiniteHBD:破局超節點擴展瓶頸

文章出處:【微信號:曦智科技,微信公眾號:曦智科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    分布式伏發電優點、實現路徑以及趨勢

    分布式伏發電是指利用太陽能伏板,將太陽光直接轉換成電能的一種方式,其特點是發電單元規模較小,且直接部署在電力需求側附近,如住宅屋頂、商業樓宇、工業廠房等。與傳統的集中式大型
    的頭像 發表于 04-08 09:18 ?305次閱讀

    伏規約轉換器分布式伏調控“四可”并網實施案例

    1.背景近年來,隨著國家分布式伏的利好政策,各地分布式伏裝機規模增加迅猛。分布式伏具有間歇
    的頭像 發表于 12-19 10:13 ?4262次閱讀
    <b class='flag-5'>光</b>伏規約轉換器<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏調控“四可”并網實施案例

    福祿克產品在分布式屋頂伏系統運維中的應用案例

    分布式伏通常指在用戶場地附近建設,容量相對較小的伏發電設施。屋頂伏作為分布式伏的
    的頭像 發表于 11-21 17:13 ?1722次閱讀

    Acrel-1000DP分布式伏監控系統成功落地奉賢平食品 4.4MW 分布式伏項目

    、概述 上海華電奉賢平食品 4408.085kwp 分布式伏發電項目(以下簡稱“本項目”)是響應國家“優化能源結構,提供更加清潔、可靠的能源”的號召,投資建設的
    的頭像 發表于 11-12 10:17 ?533次閱讀

    如何解決分布式伏計量難題?

    分布式伏成增長主力 據《2025-2030年中國分布式伏行業市場前景預測及未來發展趨勢研究報告》顯示,2024年中國分布式
    的頭像 發表于 11-07 14:55 ?389次閱讀
    如何解決<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏計量難題?

    分布式伏環境監測站的技術架構與應用實踐

    分布式伏環境監測站的技術架構與應用實踐 柏峰【BF-GFQX】、系統技術架構解析 分布式
    的頭像 發表于 10-13 10:05 ?717次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏環境監測站的技術<b class='flag-5'>架構</b>與應用實踐

    伏監控案例分享!奉賢平食品4.4MW分布式伏電站:實時監控+智能運維

    摘 要:在“雙碳”和新型電力系統建設背景下,分布式伏接入比例不斷提高,對配電網電壓、調度運行及調峰等環節造成強烈沖擊。本文設計包含平臺層、設備層二層架構體系的分布式
    的頭像 發表于 09-01 17:49 ?1588次閱讀
    <b class='flag-5'>光</b>伏監控案例分享!奉賢平<b class='flag-5'>高</b>食品4.4MW<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏電站:實時監控+智能運維

    【節能學院】Acrel-1000DP分布式伏監控系統在奉賢平食品 4.4MW 分布式伏中應用

    摘要:在“雙碳”和新型電力系統建設背景下,分布式伏接入比例不斷提高,對配電網電壓、調度運行及調峰等環節造成強烈沖擊。本文設計包含平臺層、設備層二層架構體系的分布式
    的頭像 發表于 08-23 08:04 ?3615次閱讀
    【節能學院】Acrel-1000DP<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監控系統在奉賢平<b class='flag-5'>高</b>食品 4.4MW <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏中應用

    分布式伏發電監測系統技術方案

    分布式伏發電監測系統技術方案 柏峰【BF-GFQX】、系統目標 :分布式伏發電監測系統旨在通過智能化的監測手段,實現對
    的頭像 發表于 08-22 10:51 ?3415次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發電監測系統技術方案

    中國首條&quot;算力軌&quot;通車!國內首個分布式互連交換超節點發布

    電子發燒友網報道(文 / 吳子鵬)超節點技術(SuperPod)是一種通過高帶寬、低時延互連技術,將大量 GPU芯片整合為統超級計算單元的技術架構。它突破了傳統單服務器
    發表于 08-01 08:59 ?6594次閱讀
    中國首條&quot;算力<b class='flag-5'>光</b>軌&quot;通車!國內首個<b class='flag-5'>分布式</b><b class='flag-5'>光</b>互連<b class='flag-5'>光</b><b class='flag-5'>交換</b>超節點發布

    安科瑞分布式伏監控系統:賦能園區企業伏用電智能化管理

    維成本,成為了園區企業面臨的重要挑戰。安科瑞分布式伏監控系統應運而生,為園區企業提供了套全面、智能的伏用電管理解決方案。(18721098782----安科瑞) 系統
    的頭像 發表于 07-30 15:57 ?901次閱讀
    安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監控系統:賦能園區企業<b class='flag-5'>光</b>伏用電智能化管理

    分布式伏總出問題?安科瑞分布式伏監控系統來“救場”

    分布式伏的痛點大揭秘 在 “雙碳” 目標的大力推動下,分布式伏作為綠色能源領域的重要力量,正以前所未有的速度蓬勃發展,越來越多的企業
    的頭像 發表于 07-16 16:50 ?924次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏總出問題?安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監控系統來“救場”

    分布式伏發電監控系統

    、低壓并網分布式伏電站的升壓系統、伏逆變器等設備進行全面監控,采集微機保護裝置、自動控制設備、電能質量監測裝置、伏逆變器、
    的頭像 發表于 06-25 13:41 ?1093次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發電監控系統

    分布式伏監測難?并網型分布式伏系統伏功率預測方案

    分布式伏發電系統 ? 安科瑞 鄒玉麗 ? 分布式伏發電系統的基本設備包括伏電池組件、
    的頭像 發表于 05-20 10:17 ?1395次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監測難?并網型<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏系統<b class='flag-5'>光</b>伏功率預測方案

    分布式伏電力問題層出不窮?安科瑞分布式伏運維系統來“救場”

    分布式伏電力運維,痛點大揭秘? ? 分布式伏作為實現綠色能源轉型的關鍵環,近年來在我國
    的頭像 發表于 05-07 17:14 ?1067次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏電力問題層出不窮?安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏運維系統來“救場”