国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種基于分布式光交換的高帶寬域架構InfiniteHBD

曦智科技 ? 來源:曦智科技 ? 2025-06-09 10:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

曦智科技聯合北京大學、階躍星辰為下一代萬億參數大模型訓練的基礎設施建設提出全新解決方案。

隨著大模型參數規模的擴大,分布式訓練成為人工智能發展的核心途徑。分布式訓練可以將模型數據分配給多個計算節點,進行并行計算和數據管理,從而顯著加速模型訓練的過程,而高帶寬域(High Bandwidht Domain, HBD)的設計對提升模型算力利用率至關重要。

然而,現有的HBD架構在可擴展性、成本和容錯能力等方面存在根本性限制:

交換機中心的HBD(如NVIDIA NVL72)成本高昂、不易擴展規模。

以以AI 加速器(包括GPU 與專用ASIC)為中心的HBD(如Google TPUv3和Tesla Dojo)存在嚴重的故障傳播問題。

2022 年Google發布TPU v4 集群,首次采用光交換方案(Optical Circuit Switch,以下簡稱“OCS”),這種交換機-GPU混合的HBD在互連成本與系統擴展性之間采取了折中方案,但仍存在故障爆炸半徑問題,其成本和容錯能力仍不甚理想。

70f2da02-41b9-11f0-b715-92fbcf53809c.jpg

在此背景下,曦智科技聯手北京大學、階躍星辰的研究團隊提出了一種以光交換(OCS)模組為中心的高帶寬域架構InfiniteHBD,通過在光電轉換模組中集成OCS能力,InfiniteHBD實現了動態可重構的單點對多點連接,具備節點級故障隔離和低資源碎片化的能力。

InfiniteHBD在可擴展性和成本上全面優于現有方案:InfiniteHBD的單位成本僅為NVL72的31%,GPU冗余率比NVL72和TPUv4低一個數量級,且與NVIDIA DGX(單機8卡)相比,模型算力利用率最高提升3.37 倍。

該方案以論文形式被國際通信網絡領域頂級會議SIGCOMM 2025[1]接收。

曦智科技在集成硅光領域擁有十余年的產業經驗,在InfiniteHBD 方案中,創新性的開發了基于硅光子技術的分布式光交換dOCS(distributed Optical Circuit Switch),將基于馬赫曾德(MZI,Mach-Zehnder Interferometer)交換矩陣的光交換芯片集成到商用QSFP-DD 800Gbps光電轉換模組中,大幅簡化了器件結構的同時,有效提升了器件集成度,從而降低了成本和功耗,顯著提升了InfiniteHBD 的性價比和系統可擴展性。

715fa696-41b9-11f0-b715-92fbcf53809c.png

分布式光交換方案對于建設超大規模訓練集群具有以下收益:

dOCS自帶光電轉換,提供交換能力的同時可形成跨機超節點;

光交換芯片采用成熟制程,降低了對于先進制程電交換芯片的依賴;

光交換芯片對協議不敏感,適用于當前GPU連接協議碎片化的現狀

InfiniteHBD為高帶寬域架構的高效擴展提供了新的解決方案,為下一代萬億參數大模型訓練的基礎設施建設帶來了重要啟示。 注釋: [1]SIGCOMM,Special Interest Group on Data Communication,即數據通信專業組,是ACM(美國計算機協會)組織在通信網絡領域的旗艦會議。今年的SIGCOMM 將于9 月8日-11日在葡萄牙科英布拉舉行。

關于曦智科技

曦智科技是全球領先的光電混合算力提供商。公司憑借在集成光子領域的開創性技術和全球頂尖的集成電路技術研發團隊,致力于在計算需求爆發的時代,為客戶提供一系列算力躍遷解決方案,與客戶共建更智能、更可持續的世界。曦智科技從光子矩陣計算(oMAC)、片上光網絡(oNOC)和片間光網絡(oNET)三大核心技術出發,打造光子計算和光子網絡兩大產品線,與大數據、云計算、金融、自動駕駛、生物醫藥、材料研究等領域客戶開展緊密合作,持續為客戶提供更具創造性的高效算力支撐。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    839

    瀏覽量

    40098
  • 算力
    +關注

    關注

    2

    文章

    1528

    瀏覽量

    16741
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5179

原文標題:曦科技|基于分布式光交換高帶寬域InfiniteHBD:破局超節點擴展瓶頸

文章出處:【微信號:曦智科技,微信公眾號:曦智科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    福祿克產品在分布式屋頂伏系統運維中的應用案例

    分布式伏通常指在用戶場地附近建設,容量相對較小的伏發電設施。屋頂伏作為分布式伏的
    的頭像 發表于 11-21 17:13 ?1599次閱讀

    Acrel-1000DP分布式伏監控系統成功落地奉賢平食品 4.4MW 分布式伏項目

    、概述 上海華電奉賢平食品 4408.085kwp 分布式伏發電項目(以下簡稱“本項目”)是響應國家“優化能源結構,提供更加清潔、可靠的能源”的號召,投資建設的
    的頭像 發表于 11-12 10:17 ?448次閱讀

    分布式伏環境監測站的技術架構與應用實踐

    分布式伏環境監測站的技術架構與應用實踐 柏峰【BF-GFQX】、系統技術架構解析 分布式
    的頭像 發表于 10-13 10:05 ?578次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏環境監測站的技術<b class='flag-5'>架構</b>與應用實踐

    伏監控案例分享!奉賢平食品4.4MW分布式伏電站:實時監控+智能運維

    摘 要:在“雙碳”和新型電力系統建設背景下,分布式伏接入比例不斷提高,對配電網電壓、調度運行及調峰等環節造成強烈沖擊。本文設計包含平臺層、設備層二層架構體系的分布式
    的頭像 發表于 09-01 17:49 ?1465次閱讀
    <b class='flag-5'>光</b>伏監控案例分享!奉賢平<b class='flag-5'>高</b>食品4.4MW<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏電站:實時監控+智能運維

    【節能學院】Acrel-1000DP分布式伏監控系統在奉賢平食品 4.4MW 分布式伏中應用

    摘要:在“雙碳”和新型電力系統建設背景下,分布式伏接入比例不斷提高,對配電網電壓、調度運行及調峰等環節造成強烈沖擊。本文設計包含平臺層、設備層二層架構體系的分布式
    的頭像 發表于 08-23 08:04 ?3492次閱讀
    【節能學院】Acrel-1000DP<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監控系統在奉賢平<b class='flag-5'>高</b>食品 4.4MW <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏中應用

    分布式伏發電監測系統技術方案

    分布式伏發電監測系統技術方案 柏峰【BF-GFQX】、系統目標 :分布式伏發電監測系統旨在通過智能化的監測手段,實現對
    的頭像 發表于 08-22 10:51 ?3195次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發電監測系統技術方案

    中國首條&quot;算力軌&quot;通車!國內首個分布式互連交換超節點發布

    電子發燒友網報道(文 / 吳子鵬)超節點技術(SuperPod)是一種通過高帶寬、低時延互連技術,將大量 GPU芯片整合為統超級計算單元的技術架構。它突破了傳統單服務器
    發表于 08-01 08:59 ?6471次閱讀
    中國首條&quot;算力<b class='flag-5'>光</b>軌&quot;通車!國內首個<b class='flag-5'>分布式</b><b class='flag-5'>光</b>互連<b class='flag-5'>光</b><b class='flag-5'>交換</b>超節點發布

    安科瑞分布式伏監控系統:賦能園區企業伏用電智能化管理

    維成本,成為了園區企業面臨的重要挑戰。安科瑞分布式伏監控系統應運而生,為園區企業提供了套全面、智能的伏用電管理解決方案。(18721098782----安科瑞) 系統
    的頭像 發表于 07-30 15:57 ?770次閱讀
    安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監控系統:賦能園區企業<b class='flag-5'>光</b>伏用電智能化管理

    分布式伏發電監控系統

    、低壓并網分布式伏電站的升壓系統、伏逆變器等設備進行全面監控,采集微機保護裝置、自動控制設備、電能質量監測裝置、伏逆變器、
    的頭像 發表于 06-25 13:41 ?945次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發電監控系統

    分布式伏電力問題層出不窮?安科瑞分布式伏運維系統來“救場”

    分布式伏電力運維,痛點大揭秘? ? 分布式伏作為實現綠色能源轉型的關鍵環,近年來在我國
    的頭像 發表于 05-07 17:14 ?964次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏電力問題層出不窮?安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏運維系統來“救場”

    分布式伏發運維系統實際應用案例分享

    和可持續發展的重要推動力量。國家能源局于2025年1月發布了《分布式伏發電開發建設管理辦法》,對分布式伏的分類、上網模式、備案管理、電網接入等進行了詳細規定,未來
    的頭像 發表于 04-09 14:46 ?1249次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發運維系統實際應用案例分享

    分布式伏運維困境如何破?安科瑞伏運維云平臺來支招

    分布式伏的發展與現狀 ? 在全球積極推進清潔能源轉型的大背景下,分布式伏作為一種綠色、高
    的頭像 發表于 03-24 14:38 ?812次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏運維困境如何破?安科瑞<b class='flag-5'>光</b>伏運維云平臺來支招

    分布式伏如何實現防逆流?

    分布式伏如何實現防逆流
    的頭像 發表于 03-24 13:31 ?818次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏如何實現防逆流?

    淺談分布式伏系統在工業企業的設計及應用

    主要對工業廠區屋頂分布式伏發電系統的設計及應用進行研究,為工業廠區能源供應提供一種全新的解決思路和技術支持。介紹了工業廠區屋頂分布式伏系
    的頭像 發表于 03-21 14:24 ?965次閱讀
    淺談<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏系統在工業企業的設計及應用

    分布式伏如何重塑社區能源生態

    1概述 ? ? ? ?分布式伏系統是一種伏發電設備分散安裝在用戶側或負荷中心附近的發電系統。與集中式伏電站不同,
    的頭像 發表于 03-17 14:17 ?845次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏如何重塑社區能源生態