7月27日, 2025年世界人工智能大會在上海世博中心開幕,來自深圳兩家ICT公司華為、中興通訊分別展示了自身獨創(chuàng)的,或者聯(lián)合其他廠商打造的算力底座的旗艦產(chǎn)品。
作為中國自主的算力核彈,華為昇騰384超節(jié)點真機首次亮相。中興通訊、上海儀電、曦智科技、壁仞科技聯(lián)合打造的光互聯(lián)芯片及超節(jié)點應用創(chuàng)新方案榮獲2025年世界人工智能大會最高獎。本文將對這兩款重點產(chǎn)品進行分析。
超越英偉達GB200 NVL72系統(tǒng),華為昇騰384超節(jié)點整機首次亮相
在WAIC大會現(xiàn)場,這款號稱鎮(zhèn)館之寶的華為昇騰384超節(jié)點整機前,聚集了來自全國各地,海外的參觀者和工程師,這款整機算力高達300 PFLOPs,內(nèi)存帶寬1229TB/秒,網(wǎng)絡帶寬269TB/秒,算力是英偉達GB200 NVL72系統(tǒng)的2倍,內(nèi)存帶寬暴漲113%,組網(wǎng)速度快107%,引領算力新基建。
英偉達CEO黃仁勛曾表示,從技術參數(shù)看,華為的CloudMatrix 384超節(jié)點,性能上甚至超越了英偉達,比英偉達的尖端技術更具優(yōu)勢,因此我們必須高度重視這家實力雄厚的公司,全力以赴應對挑戰(zhàn)。半導體研究公司 Semi Analysis 稱,CloudMatrix 384 在幾個關鍵領域的表現(xiàn)優(yōu)于 Nvidia 的 GB200 NVL72,特別是在訓練海量人工智能模型或運行要求苛刻的推理工作負載方面。

圖片來自華為中國官方微信
早在HDC2025大會上,華為云CEO張平安就宣布了,基于華為云CloudMatrix384超節(jié)點的新一代昇騰云服務已經(jīng)在蕪湖、貴安、烏蘭察布和林格爾全面上線。張平安說,華為云致力于為大家提供澎湃的AI算力,讓大家不再有AI算力短缺的焦慮。
華為云CloudMatrix384超節(jié)點整機的原理,按照張平安的說法是,數(shù)學補物理,空間換算力,能源助性能,打破傳統(tǒng)AI服務器的邊界,通過系統(tǒng)級的創(chuàng)新,將384顆昇騰NPU和192顆鯤鵬CPU通過全新的高速網(wǎng)絡MatrixLink對等互聯(lián),形成一臺超級AI服務器。
華為首次線下展出昇騰384超節(jié)點,即Atlas 900 A3 SuperPoD,該產(chǎn)品基于超節(jié)點架構(gòu),通過總線技術實現(xiàn)384個NPU之間的大帶寬低時延互聯(lián),解決集群內(nèi)計算、存儲等各資源之間的通信瓶頸。通過系統(tǒng)工程的優(yōu)化,實現(xiàn)資源的高效調(diào)度,讓超節(jié)點像一臺超級計算機一樣工作。算力規(guī)模300 PFlops,單卡的推理量,從每秒600Token躍升到現(xiàn)在每秒2300Token,提升4倍,成功打破跨機通信帶寬性能瓶頸,實現(xiàn)從服務器級到矩陣級的資源供給模式轉(zhuǎn)變。
這款整機具備四大技術特點:一、吞吐突破性能強,可以實現(xiàn)軟硬件協(xié)同優(yōu)化,單卡Decoding吞吐達到2300Tokens;其次,主流模型覆蓋多,沉淀了行業(yè)主流160+模型,可以高效支撐模型遷移;三、專家并行效率高,國內(nèi)首創(chuàng)的大規(guī)模專家并行方案,可以實現(xiàn)系統(tǒng)級優(yōu)化支撐更大吞吐、更低decode時延;四、規(guī)模靈活,初始投資小,每年迭代發(fā)布新版本,可以實現(xiàn)彈性靈活按需使用。據(jù)悉,目前華為云CloudMatrix384超節(jié)點已經(jīng)在行業(yè)中得到應用,包括支撐新浪“智慧小浪”推理交付效率50%以上,支撐硅基流動每天為600萬用戶提供推理服務,支持中科院自研大模型,推動面壁智能“小鋼炮”模型推理業(yè)務性能提升,助力訊飛大模型實現(xiàn)推理性能等。
借助 CloudMatrix 384,華為現(xiàn)在提供了一種可靠、可擴展且本地制造的替代方案。作為中國最大的科技公司,華為盡管受到美國出口限制,但仍在迅速取得進展。專家表示,這可能會重塑人工智能基礎設施和硬件的未來。
SAIL項目在上海落地!中興+曦智科技+壁仞發(fā)布國內(nèi)首個光互聯(lián)GPU超節(jié)點
在本次大會上,曦智科技聯(lián)合壁仞科技、中興通訊共同推出的光躍LightSphere X——全球首個分布式光互連光交換GPU超節(jié)點解決方案獲得2025 SAIL獎(卓越人工智能引領者獎)。

7月27日,曦智科技創(chuàng)始仁、首席執(zhí)行官沈亦晨表示,算力發(fā)展類比電力革命,正如電力提升生活舒適度,算力飛躍將釋放思維與精力潛能,而光子芯片正以創(chuàng)新技術開辟新賽道,成為算力突破的核心引擎。
該超節(jié)點基于曦智科技全球首創(chuàng)的分布式光交換技術,采用硅光技術的光互連光交換芯片和壁仞科技自主原創(chuàng)架構(gòu)的大算力通用GPU液冷模組與全新載板互連,并搭載中興通訊高性能AI國產(chǎn)服務器及儀電智算云平臺軟件,構(gòu)建起高帶寬、低延遲、靈活可擴展的自主可控智算集群新范式,即將于上海儀電智算中心落地。

圖:光躍LightSphere X展示,來自中興通訊官方微信
據(jù)悉,當前業(yè)界一種常見方案是通過提升單機柜功耗來部署更多GPU,但受限于數(shù)據(jù)中心單機柜的功耗天花板,單機柜GPU密度提升存在瓶頸。對此,光躍LightSphere X采用光互連技術,通過增加機柜數(shù)量構(gòu)建超節(jié)點,突破傳統(tǒng)互連方式下超節(jié)點的物理限制。
光躍LightSphere X全球首創(chuàng)的分布式光交換(dOCS)技術則進一步提升了超節(jié)點的靈活度和系統(tǒng)可擴展性,從而達到提升系統(tǒng)性價比的目的,還能按模型算力需求動態(tài)調(diào)整超節(jié)點規(guī)模,光躍LightSphere X將實現(xiàn)2千卡規(guī)模部署。
據(jù)悉,光躍LightSphere X依托上海儀電算力底座,集合國內(nèi)智算領域頭部企業(yè),共建了“光芯片-GPU-服務器-算力集群-智算云平臺”閉環(huán),打造了開放共享的光電融合算力生態(tài)體系。上海儀電(集團)有限公司是上海市國資委所屬的產(chǎn)業(yè)發(fā)展類集團、上海市公共算力服務平臺核心建設單位和智算自主可控國產(chǎn)軟硬件生態(tài)“鏈主”企業(yè)。
值得關注的是,曦智科技創(chuàng)新分布式光交換模組,可以支持集群內(nèi)GPU互聯(lián)拓撲的靈活切換,并在特殊情況下,可以利用冗余迅速重組超節(jié)點網(wǎng)絡,顯著提升大模型訓推能力,極大的拓展了集群的應用場景。此外,曦智科技與沐曦合作的光互連電交換超節(jié)點方案也首次公開亮相。該方案采用線性直驅(qū)光互連技術,具有低延時、高帶寬、低功耗的特點,并支持長距離傳輸,突破跨機柜連接的限制,支持8臺標準服務器共64張xPU卡的高速互連,為大模型訓練及推理提供更靈活、更高效的并行策略支持,從而提升集群性能。
中興通訊表示,公司將堅持智算戰(zhàn)略主航道持續(xù)深化AI領域投入,基于自主創(chuàng)新實力和全棧智算解決方案,助力全球運營商和合作伙伴構(gòu)建開放、互利的AI新生態(tài)。
本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。微信號zy1052625525。需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱zhangying@huaqiu.com。
-
NVIDIA
+關注
關注
14文章
5676瀏覽量
110047 -
gpu
+關注
關注
28文章
5244瀏覽量
135963 -
中興通訊
+關注
關注
7文章
2165瀏覽量
58676
發(fā)布評論請先 登錄
最全!一文看懂華為昇騰芯片和超節(jié)點最新演進路線
華為發(fā)布全新昇騰950PR,Atlas 350單卡算力接近3倍于H20
2026華為中國合作伙伴大會昇騰人工智能伙伴峰會圓滿落幕
中興通訊重磅發(fā)布超節(jié)點技術白皮書
奇異摩爾ODCC 2026超節(jié)點大會精彩回顧
中科曙光scaleX640超節(jié)點亮相2025世界計算大會
昆侖芯超節(jié)點亮相,單卡性能提升95%
華為發(fā)布全球最強算力超節(jié)點和集群
華為超節(jié)點互聯(lián)技術引領AI基礎設施新范式
商湯科技聯(lián)合華為昇騰實現(xiàn)超節(jié)點適配多項創(chuàng)新
中國首條"算力光軌"通車!國內(nèi)首個分布式光互連光交換超節(jié)點發(fā)布
上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊發(fā)布國內(nèi)首個光互連光交換GPU超節(jié)點——光躍LightSphere X
華為開發(fā)者大會2025(HDC 2025)亮點:華為云發(fā)布盤古大模型5.5 宣布新一代昇騰AI云服務上線
重磅!華為昇騰384超節(jié)點真機登場,中興攜廠商首秀GPU超節(jié)點實力
評論