伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI網絡國產化破局未來可期

奇異摩爾 ? 來源:奇異摩爾 ? 2025-09-18 15:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Hot Chips 2025大會聚焦高性能計算與網絡技術的突破性進展,國際廠商密集發布新一代網絡產品,折射出AI大模型浪潮下對算力&網絡架構的迫切需求。在這場圍繞高性能、高吞吐、低延時發展的性能競賽中,AMD、NVIDIA都結合自身發展路線推出創新網絡解決方案從而勾勒出AI原生網卡的主流技術路線趨勢。

UEC Ready的關鍵功能成為主流

高性能網卡廠商的必選項

AMD作為UEC聯盟的主要發起單位之一發布了AMD Pensando Pollara 400網卡,聲稱其是符合超以太網聯盟(UEC)規范的AI NIC,全面支持UEC Ready RDMA。盡管NVIDIA并未聲稱其ConnectX-8 SuperNIC 參照UEC路線設計,但從網卡的性能及功能來看,兩者均最終實現多路徑傳輸、自適應路由、擁塞控制等維度的多項AI網絡原生無損網絡功能。

多路徑傳輸

NVIDIA 在其AI Networking白皮書中曾重點提及傳統數據中心的應用程序會產生大量的小數據流,這使得網絡流量的統計平均值能夠反映整體情況。在這種背景下,基于簡單靜態哈希的路由算法,如等價多路徑(ECMP,Equal Cost Multi-Path),足以應對常見的網絡流量問題。然而,人工智能工作負載的特性卻截然不同。它們通常會產生少量的大數據流,被稱為“大象流”(elephant flows)。這些大象流會占用大量的鏈路帶寬,如果多個大象流被路由到同一鏈路,就會導致嚴重的擁塞和高延遲。

因此,在設計AI NIC過程中率先提出引入自適應路由算法并運用數據包噴灑技術實現AI網絡的多路徑傳輸功能。

550ba73e-8489-11f0-a18e-92fbcf53809c.png

(來源:英偉達AI Networking白皮書)

AMD 在Hotchips 2025大會上同樣提及有損RDMA的ECMP Hash沖突痛點并參照UEC 1.0規范通過數據包噴灑實現多路徑傳輸。與此同時,AMD網卡標記UDP端口號/UEC路徑熵值以控制路徑選擇并根據ECN和修剪數據包反饋跟蹤路徑狀態。

55208244-8489-11f0-a18e-92fbcf53809c.png

(圖: AMD解釋ECMP Hash沖突挑戰)

5534ef7c-8489-11f0-a18e-92fbcf53809c.png

(圖:AMD 使用包噴灑技術實現多路徑傳輸)

盡管英偉達和AMD在實現流量控制過程中采用的技術存在一些差異,但最終也以數據包噴灑技術實現多路徑傳輸為網絡控制目的。多路徑的存在使得具備該性能的網卡能夠提供極快的丟包替換和超快的流量控制,即使在應用程序調度不佳或網絡鏈路偶爾出現波動的情況下,也能確保流暢的流量傳輸。

擁塞控制

AI和HPC應用經常采用集合通信在多個節點之間同步信息,當多個發送方同時向單個接收方發送數據流,并且任何一個發送方都將發送完當前所有的數據流后,才開始發送后續的數據流。由于同時發送過多的數據流,會造成接收方的交換機緩沖區過載,使得接收方無法正常接收數據,即會產生Incast現象,而這種網絡擁塞現象將大大影響并增加尾延遲。

554c71a6-8489-11f0-a18e-92fbcf53809c.png

(圖:AMD 解釋擁塞控制)

AMD AI 網卡采用基于UEC標準的UEC-CC擁塞控制技術從而解決擁塞控制問題。據UEC 1.0標準,UEC-CC 采用基于時間的機制,具備亞500納秒精度的傳輸時延測量能力,獨立測量數據包的前向路徑和反向路徑,這意味著網卡之間需要進行絕對時間同步。雙向測量可以準確地將擁塞歸因于發送方和接收方。如果啟用了 UEC-CC,交換機需要支持 ECN(顯式擁塞通知),并且預計將使用現代 ECN 變體:在每個流量類別上單獨設置擁塞標志,并在數據包傳輸前立即進行測量。這種設置提供了最新的擁塞信息,并針對每個流量類別進行差異化處理,從而達到優化擁塞控制功能。

5563158c-8489-11f0-a18e-92fbcf53809c.png

英偉達的CX-8 SuperNIC 則使用RISC-V DPA processor來實現擁塞控制功能。在Transport層的Event和路由層的Event都會由DPA處理。在本次Hotchips 2025的演講中,其并未披露其DPA的細節,但大概率集成了類似UEC的擁塞控制功能。

選擇性重傳

在傳統傳輸協議,如TCP需要嚴格的傳輸順序,會采用了Go-Back-N機制。而一個RDMA消息通常包含多個數據包,只要有一個數據包錯誤,就必須從這個數據包起的所有數據包都要重傳。在 AI 工作負載中,大量的GPU或者Accelerator間通信是“集合”通信操作的一部分,其中 All-Reduce 和 All-to-All 是主要的集合通信類型。這類通信快速完成的關鍵是從 A 到 B 的快速批量傳輸,AI 應用程序關心給定消息的最后部分何時到達目的地。所以對AI網絡而言,這讓原有的丟包和其處理機制將傳輸錯誤放大,大量的重傳加劇了網絡擁塞,降低AI網絡傳輸效率。

5575f1fc-8489-11f0-a18e-92fbcf53809c.png

558bf75e-8489-11f0-a18e-92fbcf53809c.png

(圖: AMD 描述網絡丟包及其選擇性重傳解決方案)

AMD AI NIC 落實了UEC中的選擇性重傳機制,高性能的RDMA會判斷出整個消息中哪個報文被網絡丟棄,基于UEC RDMA的網卡通知發送端重傳這個報文,而非將所有傳輸包都需重傳。這種選擇性重傳機制大大改善了AI網絡的傳輸效率,提升AI 大模型訓推效能。

上述一系列的高性能RDMA功能是面向AI大規模原生網絡Scale Out的關鍵解決方案,也成為下一代主流AI網卡的必備功能。奇異摩爾的Kiwi SNIC 滿足上述面向 AI 原生的 Adv. RDMA 功能,不限于多路徑傳輸、選擇性重傳、高性能擁塞控制管理技術等。

高性能網卡的額外特性

Nvidia ConnectX-8 SuperNIC

集成PCIe Switch功能

這一代ConnectX-8 超級網卡從ConnectX-7的400G躍升至800G,并集成了PCIe Switch,與Spectrum-X Switch、NVLink協同工作。硬件性能方面,CX-8 的800 Gb/s的RDMA硬件管線和其通過內置的PCIe Gen6 Switch芯片,可支持多達48條PCIe Gen6通道,解決了多設備互聯的帶寬瓶頸問題。

AMD 網卡引入P4可編程架構

實現網絡功能定制化

55cef914-8489-11f0-a18e-92fbcf53809c.png

(來源: AMD)

AMD網卡的P4可編程架構中,表引擎(TE)和匹配處理單元(MPU)為核心組件,提供了靈活的字段操作指令和高效的數據包處理能力。官方數據顯示,在RoCEv2測試中,相較于4Q pairs和1Q pair的性能分別提升了25%和40%。

我們知道ASIC架構的網卡相較于FPGA在性能及性價比上都更適合超大規模網絡的互聯,但是在面向應用快速發展的情況下,靈活性有所不足。基于可編程架構的 ASIC,打破了固有架構ASIC靈活性不足的局限。通過植入可編程引擎可以靈活應對AI算法、系統對于網絡持續演進的需求,重構 ASIC芯片可編程可定制的技術范式。

奇異摩爾Kiwi SNIC 超級網卡同樣基于可編程ASIC架構,內置HPDE高性能可編程數據DSA。HPDE基于可定義可擴展的網絡加速指令集,通過重編譯來靈活支持新的協議標準和加速算法,這種高性能可編程數據處理引擎不僅支持先進擁塞控制算法,實現可編程包頭識別及處理、鏈接跟蹤功能并具有很強的靈活性來應對軟硬件升級。

國產化AI網絡自主自控未來可期

在2025中國算力大會上,工業和信息化部明確表示將有序引導算力設施建設,深入開展算力強基"揭榜"行動,聚焦計算、存儲、網絡等重點方向。這一戰略部署將加速國產AI網絡芯片、操作系統等核心技術的研發突破,減少對外部技術的依賴。這一政策導向為國產化AI網絡產品的自主自控發展奠定了堅實基礎

奇異摩爾作為AI網絡互聯全棧式互聯產品提供商也在積極探索AI網絡芯片的多元化的集成技術路徑。展望未來,隨著Scale out和Scale up網絡的進一步融合,奇異摩爾的NDSA統一架構平臺將積極發揮其網絡+計算的雙優優勢,從而進一步實現網卡功能集成IO Die芯粒 /集成Switch等多種創新技術路徑,構建更高性能、更高效能、更靈活的網絡基礎設施,以滿足國產AI的飛速發展需求。

關于我們

AI網絡全棧式互聯架構產品及解決方案提供商

奇異摩爾,成立于2021年初,是一家行業領先的AI網絡全棧式互聯產品及解決方案提供商。公司依托于先進的高性能RDMA 和Chiplet技術,創新性地構建了統一互聯架構——Kiwi Fabric,專為超大規模AI計算平臺量身打造,以滿足其對高性能互聯的嚴苛需求。我們的產品線豐富而全面,涵蓋了面向不同層次互聯需求的關鍵產品,如面向北向Scale-out網絡的AI原生超級網卡、面向南向Scale-up網絡的GPU片間互聯芯粒、以及面向芯片內算力擴展的2.5D/3D IO Die和UCIe Die2Die IP等。這些產品共同構成了全鏈路互聯解決方案,為AI計算提供了堅實的支撐。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5698

    瀏覽量

    140268
  • 網絡
    +關注

    關注

    14

    文章

    8312

    瀏覽量

    95434
  • AI
    AI
    +關注

    關注

    91

    文章

    40579

    瀏覽量

    302226

原文標題:HotChips 2025啟示錄: AI網絡國產化破局未來可期

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國產化矩陣,上海兆越高速工業WIFI6無線AP優選上新

    探索與實踐。未來,上海兆越將繼續聚焦工業通信領域國產化創新,持續完善產品矩陣、升級技術性能,為政府、能源、高端制造、特種行業等關鍵領域提供更全面、更可靠的全國產化
    的頭像 發表于 04-01 17:30 ?197次閱讀
    全<b class='flag-5'>國產化</b>矩陣,上海兆越高速工業WIFI6無線AP優選上新

    Neway微波產品國產化替代電源模塊的市場前景如何

    Neway微波產品國產化替代電源模塊的市場前景如何Neway微波產品國產化替代電源模塊的市場前景廣闊,主要得益于技術突破、成本優勢、政策支持、供應鏈安全需求及市場響應速度提升等多重因素的驅動。技術
    發表于 02-27 09:55

    強強聯合|千視電子與 VINGLOOP 共建國產化 AV-over-IP 整體解決方案

    馬年啟新程,合作創未來2026馬年伊始,千視電子(Kiloview)與VINGLOOP正式宣布聯合打造國產化AV-over-IP整體解決方案。雙方圍繞AV-over-IP技術架構,在終端設備、網絡
    的頭像 發表于 02-25 14:50 ?3331次閱讀
    強強聯合|千視電子與 VINGLOOP 共建<b class='flag-5'>國產化</b> AV-over-IP 整體解決方案

    Neway微波國產化替代方案

    Neway微波國產化替代方案Neway對微波產品電源模塊進行全面優化,采用國產電源組件替代進口產品。實際測試表明,國產電源組件在轉換效率(達94%以上)、紋波系數(<50mV)等
    發表于 01-30 08:45

    Neway微波產品的國產化替代方案

    國產化替代方案主要體現在電源模塊優化、關鍵部件自主、供應鏈本地及技術兼容性適配四個方面。一、電源模塊全面國產化替代Neway對微波產品的電源模塊進行全面優化,提供
    發表于 12-18 09:24

    巨霖科技分享國產SI仿真工具的之道

    11月20日,2025集成電路發展論壇(成渝)暨三十一屆集成電路設計業展覽會(ICCAD-Expo 2025)在成都正式啟幕。巨霖科技副總經理鄧俊勇在“EDA與IC設計服務”專題論壇發表題為《國產 SI 仿真工具之道》的演講
    的頭像 發表于 12-16 10:14 ?584次閱讀
    巨霖科技分享<b class='flag-5'>國產</b>SI仿真工具的<b class='flag-5'>破</b><b class='flag-5'>局</b>之道

    OBOO鷗柏丨信息查詢展示終端65英寸觸控屏國產化系統AI科技

    信息查詢展示終端55英寸觸控屏:國產化系統與AI科技如何重塑交互體驗?在數字浪潮席卷各行各業的今天,信息查詢與展示終端已成為連接用戶與信息、服務的關鍵樞紐。其中,OBOO鷗柏65英寸大尺寸觸控屏
    的頭像 發表于 12-04 14:54 ?665次閱讀
    OBOO鷗柏丨信息查詢展示終端65英寸觸控屏<b class='flag-5'>國產化</b>系統<b class='flag-5'>AI</b>科技

    ALVA打造機器視覺國產化替代新標桿

    “十五五”規劃明確,到 2030 年,我國工業軟件國產化率提升至 50% 以上,目標實現高端數控機床 90% 以上核心部件國產化
    的頭像 發表于 11-05 11:30 ?1063次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    生物化學計算機,它通過離子、分子間的相互作用來進行復雜的并行計算。因而未來可期的前景是AI硬件將走向AI濕件。 根據研究,估算出大腦的功率是20W,在進行智力活動時,其功率會增大到25
    發表于 09-06 19:12

    國產化自主可控低空警戒雷達波束賦形的系列產品解決方案

    國產化,自主可控,
    的頭像 發表于 08-19 10:44 ?1023次閱讀
    <b class='flag-5'>國產化</b>自主可控低空警戒雷達波束賦形的系列<b class='flag-5'>化</b>產品解決方案

    國產化!這款AI智能模組很硬核

    國產操作系統構建自主生態閉環,疊加8TOPS端側AI算力,為金融、能源、工業、交通等關鍵領域注入安全可信、智能高效的國產化新勢能。元器件100%國產遴選:筑牢安全基
    的頭像 發表于 06-16 19:15 ?1120次閱讀
    全<b class='flag-5'>國產化</b>!這款<b class='flag-5'>AI</b>智能模組很硬核

    清醒地堅持,瑞之辰等芯片企業以實踐推動國產化替代

    美的高新科技企業,以實踐踐行國產化替代。認清差距,堅定長期主義而立近日,華為創始人任正非在面對“如何應對當前困難”的提問時直言“不去想困難,干就完了,一步一步
    的頭像 發表于 06-13 11:40 ?1091次閱讀
    清醒地堅持,瑞之辰等芯片企業以實踐推動<b class='flag-5'>國產化</b>替代

    揚杰IGBT七單元模塊:全封裝矩陣平替進口,重構國產化功率器件新生態

    國產化 重構功率器件生態 IGBT Localization 在全球供應鏈震蕩與國產替代浪潮中,揚杰科技推出七單元IGBT全封裝解決方案,以六大封裝矩陣精準對標國際品牌,實現“零改
    的頭像 發表于 05-30 11:50 ?1084次閱讀

    !連接器國產化替代加速逆襲

    說明中國已經做好了準備!時代呼喚國產化替代的加速前行,隨著國際競爭日益激烈,技術封鎖與貿易保護主義抬頭,給中國經濟發展帶來了前所未有的挑戰。在此背景下,加快國產化
    的頭像 發表于 04-10 17:52 ?976次閱讀
    <b class='flag-5'>破</b><b class='flag-5'>局</b>!連接器<b class='flag-5'>國產化</b>替代加速逆襲

    對等關稅沖擊下 國產化PXIe海量互連如何?

    促使國產化加速。02國產化PXIe海量互連通用測試解決方案國產化海量互聯系統主要用在功能測試上,可以PXI儀器和被測單元之間的提供一個非常可靠的連接,海量互聯接口是
    的頭像 發表于 04-10 16:53 ?896次閱讀
    對等關稅沖擊下 <b class='flag-5'>國產化</b>PXIe海量互連如何?