国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

奇異摩爾賦能萬卡集群互聯

奇異摩爾 ? 來源:奇異摩爾 ? 2024-09-19 13:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,IntelAMD博通(Broadcom)、思科(Cisco)、Google、惠普(Hewlett Packard Enterprise,HPE)、Meta和微軟(Microsoft)在內的八家公司宣布他們已經為人工智能數據中心的網絡制定了新的互聯技術UALink(Ultra Accelerator Link),以打破英偉達NVLink技術壟斷的消息受到了廣泛的關注。

“本期奇說芯語Kiwi Talks 將從萬卡集群大模型算力需求的挑戰說起,來解讀這場軍備賽的背后原理…”

智算網絡催生萬卡集群

隨著大模型的持續爆發,其對算力的需求也在迅猛增長,這促使算力集群不斷向萬卡以上的規模演進。這一趨勢不僅代表著計算能力的飛躍,也對網絡提出了前所未有的超高要求。

萬卡集群是指由一萬張及以上的加速卡(包括GPU、TPU及其他專用AI加速芯片)組成的高性能計算系統,主要用于加速人工智能模型的訓練和推理過程。這種集群的構建旨在解決大模型訓練對算力需求的巨大增長問題,尤其是現在模型參數量從百億級、千億級邁向萬億級。大模型的訓練和推理任務需要海量的計算資源和高效的網絡連接。

萬卡級別的算力集群意味著將有數以萬計的高性能計算節點協同工作,它們之間的數據傳輸和同步必須達到毫秒級甚至微秒級的延遲,以確保模型訓練的高效性和準確性。首先,大模型訓練對于GPU之間的互聯通信要求極高,無論是機內GPU的通信還是服務器之間的GPU通信。特別是在模型并行和數據并行等模式下,通信數據量更是達到了百GB級別。因此,網絡必須支持高速互聯協議,并且能夠提供足夠的單端口帶寬和總帶寬。

我們知道PCIe(Peripheral Component Interconnect Express):它是一種計算機總線標準,用于在計算機內部連接各種設備和組件(例如顯卡、存儲設備、擴展卡等)。PCIe接口以串行方式傳輸數據,具有較高的通信帶寬,適用于連接各種設備。然而,由于其基于總線結構,同時連接多個設備時可能會受到帶寬的限制受限于帶寬、延遲、數據傳輸效率,已成為大規模計算集群的互聯瓶頸。

英偉達NVLink的無損網絡護城河

英偉達的NVLink是其開發并推出的一種總線及其通信協議。NVLink采用點對點結構、串列傳輸,用于中央處理器CPU)與圖形處理器(GPU)之間的連接,也可用于多個圖形處理器之間的相互連接。與PCI Express不同,一個設備可以包含多個NVLink,并且設備之間采用網格網絡而非中心集線器方式進行通信。該協議于2014年3月首次發布,采用專有的高速信號互連技術(NVHS)。目前NVLink已經升級到5.0版本。第五代 NVLink 大幅提高了大型多 GPU 系統的可擴展性。單個 NVIDIA Blackwell Tensor Core GPU 支持多達 18 個 NVLink 100 GB/s 連接,總帶寬可達 1.8 TB/s,比上一代產品提高了兩倍,是 PCIe 5.0 帶寬的 14 倍之多。

NVLink 就是這種“多節點無損網絡”的代表,由一個強大的軟件協議組成,通常通過印在計算機板上的多對導線實現,可以讓處理器以極高的速度收發共享內存池中的數據。NVLink 設計的主要設計目的,就是突破PCIe的屏障,達成GPU-GPU及CPU-GPU的片間高效數據交互。

NVLink雖擁有優秀的性能,但私有協議無法兼容不同來源的產品,這樣的封閉生態已成為行業發展掣肘。受到巨大的需求推動,以及為抵抗這種市場擠壓 ,AMD、谷歌、微軟、英特爾(Intel)、博通(Broadcom)、思科(Cisco)構成聯盟建立一個開放的行業互聯標準即UALink。UALink將使系統OEM、IT專業人員和系統集成商能夠為其人工智能連接數據中心創建一條更易于集成、更具靈活性和可擴展性的途徑。

據官方消息,UALink 1.0規范支持連接多達1024個AI加速器,并允許在一個計算集群(Pod)內,讓接入的GPU等加速器附帶的內存之間實現直接加載和存儲。

奇異摩爾賦能萬卡集群互聯

目前包括各大芯片廠商以及生態內的服務器廠商開始不斷提及甚至對標英偉達NVLink,都想要打破其所造的護城河。整個行業生態包括奇異摩爾在內的企業正在積極探索如何解決滿足集群通信間通訊,片間互聯的高效互聯的解決方案。

目前,奇異摩爾基于自身的互聯技術優勢,較早布局IO Die、Base Die等高性能互聯芯粒,并基于Kiwi-Link統一互聯架構,提供涵蓋集群間、片間、Die間的全鏈路高性能互聯解決方案

GPU片間互聯

奇異摩爾的高性能網絡加速芯粒 – Kiwi NDSA,內建RoCE V2高性能 RDMA (Remote Direct Memory Access) 和數十種卸載/加速引擎,可作為獨立芯粒應用于GPU的傳輸加速器。奇異摩爾自研的全球首創GPU Link Chiplet “NDSA-G2G”,通過RDMA和D2D技術,在芯片間搭建了高速數據交換網絡,可實現近TB/s的超高速數據傳輸,其性能達到全球領先水平,滿足AI芯片對于片間交換不斷增長的需求。

集群間通信

奇異摩爾 Kiwi NDSA SNIC是全球首款支持800G帶寬的RDMA NIC產品,具備極高的集群擴展能力,可以大幅提升集群節點間的交互效率,使得更大規模的集群設計成為可能。除帶寬升級到800G之外,延時也降至納秒級,并支持數十GB的超大規模數據包,性能媲美目前全球標桿ASIC產品。

業界紛紛提出集群通訊互聯的重要性

中國移動研究院網絡與IT技術研究所主任研究員陳佳媛在近期公開演講中提及必須突破GPU卡間互聯技術瓶頸,提高卡間互聯帶寬,提升端口數量以滿足集群算力縱向擴展升級需求;低延遲通信,減少GPU通信跳數,優化數據傳輸路徑。 新華三集團高級副總裁、云與計算存儲產品線總裁徐潤安此前也談到算力互聯。在他看來,過去,大家的目標可能是做更強算力的單顆芯片,現在會從另一個角度努力,怎樣將芯片做成更大集群,同時使得集群的通信效果更高,集群的處理能力更強;

浪潮信息高級副總裁劉軍發表的觀點是,實現更大的算力已經不在芯片,而是在算法層面做創新,比如怎么把算力分布到系統層面上,怎么解決卡間互聯問題,怎么讓更多的GPU高效協同。

寫在最后,數據中心和算力集群是AI的核心,網絡則是它的命脈,它們共同構筑了AI大模型底層網絡基礎設施,實現了數據和智能的無縫傳遞。然而AI芯片性能及軟件生態存在的差距,萬卡集群建設存在芯片間、卡之間、集群間的互聯問題,這些都需要更開放的平臺去持續地解決。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99197
  • 算力
    +關注

    關注

    2

    文章

    1532

    瀏覽量

    16744
  • 奇異摩爾
    +關注

    關注

    0

    文章

    79

    瀏覽量

    4037
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5186

原文標題:Kiwi Talks | 智算網絡催生萬卡集群,all in通信互聯軍備賽

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中科曙光3套scaleX集群落地國家超算互聯網鄭州核心節點

    2月5日,由中科曙光提供的3套集群系統在國家超算互聯網鄭州核心節點同時上線試運行,成為全國首個實現3
    的頭像 發表于 02-09 10:32 ?477次閱讀

    中科曙光scaleX集群重塑超大規模算力基礎設施

    在“人工智能+”行動深入推進的當下,算力基礎設施已成為國家戰略競爭力的核心,而超大規模集群的運維管控難題卻日益凸顯。中科曙光scaleX集群打造的智能管理體系,正以“
    的頭像 發表于 01-30 15:43 ?741次閱讀

    中科曙光scaleX集群背后的持續創新

    智算集群的發展浪潮正以超乎想象的速度襲來,未來五年,十萬級的算力集群將成為標配。但一個核心挑戰也隨之而來:當成千上的芯片緊密堆疊,如何將產生的巨額熱量快速帶走?
    的頭像 發表于 01-19 14:49 ?613次閱讀

    奇異摩爾參編人工智能加速器互聯芯粒技術要求團體標準發布

    近日,中國電子工業標準化技術協會批準并發布了《人工智能超節點服務器技術要求》等28項團體標準。其中由中國移動研究院牽頭、奇異摩爾產品市場&研發部門主要參編的《人工智能加速器互聯芯粒技術要求
    的頭像 發表于 01-09 11:20 ?588次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>參編人工智能加速器<b class='flag-5'>互聯</b>芯粒技術要求團體標準發布

    部分能力超越2027年NVL576,中科曙光發布scaleX集群

    2025年12月18日,在昆山舉行的光合組織2025人工智能創新大會(HAIC2025)上,中科曙光發布并展出了全球領先的大規模智能計算系統——scaleX集群,這也是國產
    發表于 12-18 18:30 ?1096次閱讀
    部分能力超越2027年NVL576,中科曙光發布scaleX<b class='flag-5'>萬</b><b class='flag-5'>卡</b>超<b class='flag-5'>集群</b>

    奇異摩爾助力中國移動GSE 2.5版本協議標準發布

    近日,在2025移動合作伙伴大會“算力網絡聯合創新”分論壇上,中國移動攜手包括奇異摩爾、中興及新華三等在內的產業合作伙伴重磅發布GSE 2.5版本協議標準,并同步啟動“國芯國連”智算開放互聯GSE
    的頭像 發表于 10-17 16:44 ?1213次閱讀

    奇異摩爾Networking for AI生態沙龍成功舉辦

    近日,中國信息通信研究院華東分院與行業領先的AI網絡全棧式互聯產品及解決方案提供商——奇異摩爾聯合舉辦的“聚力向芯 算涌無界 Networking for AI”生態沙龍活動在上海浦東成功舉辦。
    的頭像 發表于 10-09 12:45 ?792次閱讀

    奇異摩爾助力OISA全向智感互聯IO芯粒技術白皮書發布

    提供商,奇異摩爾憑借其在芯粒領域的深厚技術積累與產業實踐,多方位貢獻于該白皮書的撰寫與關鍵技術路徑的梳理工作。
    的頭像 發表于 09-23 15:55 ?2005次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>助力OISA全向智感<b class='flag-5'>互聯</b>IO芯粒技術白皮書發布

    奇異摩爾攜手中國移動發布OISA 2.0協議

    山西大同,在 2025中國算力大會主論壇上,中國移動攜手包括奇異摩爾、燧原科技、壁韌科技、摩爾線程、昆侖芯、盛科通信、浪潮集團等多家AI基礎設施產業鏈領先企業啟動智算開放互聯OISA生
    的頭像 發表于 08-27 15:08 ?3271次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>攜手中國移動發布OISA 2.0協議

    奇異摩爾田陌晨榮獲中國半導體行業領軍人物獎

    實力與發展成果。奇異摩爾創始人兼 CEO 田陌晨憑借在AI網絡互聯領域的創新成就,榮膺 “領軍人物獎”。
    的頭像 發表于 07-08 17:04 ?1830次閱讀

    燧原科技國產集群通過中國信通院權威認證

    近日,中國信息通信研究院(以下簡稱“中國信通院”)成功召開智算集群服務推進方陣年中總交流會。會議期間,中國信通院重磅發布了首批《大規模智算集群服務成熟度》評估結果。燧原科技作為算力
    的頭像 發表于 07-04 16:50 ?1222次閱讀

    弘信電子旗下燧弘華創加入智算集群服務推進方陣

    近日,中國信息通信研究院在北京召開智算集群服務推進方陣(ICCPA)年中總結交流會。會上為第二批成員單位辦法證書,發布一系列產業研究成果,并通過深度交流研討,凝聚產業共識,規范產品建設體系,搭建高效的交流平臺,引領智算
    的頭像 發表于 07-03 15:43 ?877次閱讀

    奇異摩爾攜手UALink聯盟助力AI網絡繁榮發展

    隨著AI大模型訓推集群的規模不斷擴大,Scale-up網絡的重要性已不限于訓練集群側,云端推理集群對于多機之間組成超節點HBD方案的需求正在逐步增加。面對其對互聯性能的極致追求,目前業
    的頭像 發表于 04-12 14:42 ?2016次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>攜手UALink聯盟助力AI網絡繁榮發展

    奇異摩爾互聯之長推進OISA GPU互聯生態適配

    進行了精彩的主題分享。 作為AI網絡特別組及網絡工作組的成員,奇異摩爾積極參與大會,與業界同仁共同探討AI網絡互聯應用的發展趨勢。 當前,國內外GPU
    的頭像 發表于 04-01 19:35 ?1762次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>以<b class='flag-5'>互聯</b>之長推進OISA GPU<b class='flag-5'>卡</b>間<b class='flag-5'>互聯</b>生態適配

    衢州市領導蒞臨奇異摩爾考察調研

    近日,衢州市委書記高屹率衢州市委常委、秘書長李寧,衢州智造新城黨工委書記、管委會主任方世忠等一行蒞臨奇異摩爾考察指導。奇異摩爾創始人兼CEO田陌晨協同公司高層管理人員向調研組全面展示了
    的頭像 發表于 03-18 13:55 ?1568次閱讀