7月27日, 2025年世界人工智能大會(huì)在上海世博中心開(kāi)幕,來(lái)自深圳兩家ICT公司華為、中興通訊分別展示了自身獨(dú)創(chuàng)的,或者聯(lián)合其他廠商打造的算力底座的旗艦產(chǎn)品。
作為中國(guó)自主的算力核彈,華為昇騰384超節(jié)點(diǎn)真機(jī)首次亮相。中興通訊、上海儀電、曦智科技、壁仞科技聯(lián)合打造的光互聯(lián)芯片及超節(jié)點(diǎn)應(yīng)用創(chuàng)新方案榮獲2025年世界人工智能大會(huì)最高獎(jiǎng)。本文將對(duì)這兩款重點(diǎn)產(chǎn)品進(jìn)行分析。
超越英偉達(dá)GB200 NVL72系統(tǒng),華為昇騰384超節(jié)點(diǎn)整機(jī)首次亮相
在WAIC大會(huì)現(xiàn)場(chǎng),這款號(hào)稱鎮(zhèn)館之寶的華為昇騰384超節(jié)點(diǎn)整機(jī)前,聚集了來(lái)自全國(guó)各地,海外的參觀者和工程師,這款整機(jī)算力高達(dá)300 PFLOPs,內(nèi)存帶寬1229TB/秒,網(wǎng)絡(luò)帶寬269TB/秒,算力是英偉達(dá)GB200 NVL72系統(tǒng)的2倍,內(nèi)存帶寬暴漲113%,組網(wǎng)速度快107%,引領(lǐng)算力新基建。
英偉達(dá)CEO黃仁勛曾表示,從技術(shù)參數(shù)看,華為的CloudMatrix 384超節(jié)點(diǎn),性能上甚至超越了英偉達(dá),比英偉達(dá)的尖端技術(shù)更具優(yōu)勢(shì),因此我們必須高度重視這家實(shí)力雄厚的公司,全力以赴應(yīng)對(duì)挑戰(zhàn)。半導(dǎo)體研究公司 Semi Analysis 稱,CloudMatrix 384 在幾個(gè)關(guān)鍵領(lǐng)域的表現(xiàn)優(yōu)于 Nvidia 的 GB200 NVL72,特別是在訓(xùn)練海量人工智能模型或運(yùn)行要求苛刻的推理工作負(fù)載方面。

圖片來(lái)自華為中國(guó)官方微信
早在HDC2025大會(huì)上,華為云CEO張平安就宣布了,基于華為云CloudMatrix384超節(jié)點(diǎn)的新一代昇騰云服務(wù)已經(jīng)在蕪湖、貴安、烏蘭察布和林格爾全面上線。張平安說(shuō),華為云致力于為大家提供澎湃的AI算力,讓大家不再有AI算力短缺的焦慮。
華為云CloudMatrix384超節(jié)點(diǎn)整機(jī)的原理,按照張平安的說(shuō)法是,數(shù)學(xué)補(bǔ)物理,空間換算力,能源助性能,打破傳統(tǒng)AI服務(wù)器的邊界,通過(guò)系統(tǒng)級(jí)的創(chuàng)新,將384顆昇騰NPU和192顆鯤鵬CPU通過(guò)全新的高速網(wǎng)絡(luò)MatrixLink對(duì)等互聯(lián),形成一臺(tái)超級(jí)AI服務(wù)器。
華為首次線下展出昇騰384超節(jié)點(diǎn),即Atlas 900 A3 SuperPoD,該產(chǎn)品基于超節(jié)點(diǎn)架構(gòu),通過(guò)總線技術(shù)實(shí)現(xiàn)384個(gè)NPU之間的大帶寬低時(shí)延互聯(lián),解決集群內(nèi)計(jì)算、存儲(chǔ)等各資源之間的通信瓶頸。通過(guò)系統(tǒng)工程的優(yōu)化,實(shí)現(xiàn)資源的高效調(diào)度,讓超節(jié)點(diǎn)像一臺(tái)超級(jí)計(jì)算機(jī)一樣工作。算力規(guī)模300 PFlops,單卡的推理量,從每秒600Token躍升到現(xiàn)在每秒2300Token,提升4倍,成功打破跨機(jī)通信帶寬性能瓶頸,實(shí)現(xiàn)從服務(wù)器級(jí)到矩陣級(jí)的資源供給模式轉(zhuǎn)變。
這款整機(jī)具備四大技術(shù)特點(diǎn):一、吞吐突破性能強(qiáng),可以實(shí)現(xiàn)軟硬件協(xié)同優(yōu)化,單卡Decoding吞吐達(dá)到2300Tokens;其次,主流模型覆蓋多,沉淀了行業(yè)主流160+模型,可以高效支撐模型遷移;三、專家并行效率高,國(guó)內(nèi)首創(chuàng)的大規(guī)模專家并行方案,可以實(shí)現(xiàn)系統(tǒng)級(jí)優(yōu)化支撐更大吞吐、更低decode時(shí)延;四、規(guī)模靈活,初始投資小,每年迭代發(fā)布新版本,可以實(shí)現(xiàn)彈性靈活按需使用。據(jù)悉,目前華為云CloudMatrix384超節(jié)點(diǎn)已經(jīng)在行業(yè)中得到應(yīng)用,包括支撐新浪“智慧小浪”推理交付效率50%以上,支撐硅基流動(dòng)每天為600萬(wàn)用戶提供推理服務(wù),支持中科院自研大模型,推動(dòng)面壁智能“小鋼炮”模型推理業(yè)務(wù)性能提升,助力訊飛大模型實(shí)現(xiàn)推理性能等。
借助 CloudMatrix 384,華為現(xiàn)在提供了一種可靠、可擴(kuò)展且本地制造的替代方案。作為中國(guó)最大的科技公司,華為盡管受到美國(guó)出口限制,但仍在迅速取得進(jìn)展。專家表示,這可能會(huì)重塑人工智能基礎(chǔ)設(shè)施和硬件的未來(lái)。
SAIL項(xiàng)目在上海落地!中興+曦智科技+壁仞發(fā)布國(guó)內(nèi)首個(gè)光互聯(lián)GPU超節(jié)點(diǎn)
在本次大會(huì)上,曦智科技聯(lián)合壁仞科技、中興通訊共同推出的光躍LightSphere X——全球首個(gè)分布式光互連光交換GPU超節(jié)點(diǎn)解決方案獲得2025 SAIL獎(jiǎng)(卓越人工智能引領(lǐng)者獎(jiǎng))。

7月27日,曦智科技創(chuàng)始仁、首席執(zhí)行官沈亦晨表示,算力發(fā)展類(lèi)比電力革命,正如電力提升生活舒適度,算力飛躍將釋放思維與精力潛能,而光子芯片正以創(chuàng)新技術(shù)開(kāi)辟新賽道,成為算力突破的核心引擎。
該超節(jié)點(diǎn)基于曦智科技全球首創(chuàng)的分布式光交換技術(shù),采用硅光技術(shù)的光互連光交換芯片和壁仞科技自主原創(chuàng)架構(gòu)的大算力通用GPU液冷模組與全新載板互連,并搭載中興通訊高性能AI國(guó)產(chǎn)服務(wù)器及儀電智算云平臺(tái)軟件,構(gòu)建起高帶寬、低延遲、靈活可擴(kuò)展的自主可控智算集群新范式,即將于上海儀電智算中心落地。

圖:光躍LightSphere X展示,來(lái)自中興通訊官方微信
據(jù)悉,當(dāng)前業(yè)界一種常見(jiàn)方案是通過(guò)提升單機(jī)柜功耗來(lái)部署更多GPU,但受限于數(shù)據(jù)中心單機(jī)柜的功耗天花板,單機(jī)柜GPU密度提升存在瓶頸。對(duì)此,光躍LightSphere X采用光互連技術(shù),通過(guò)增加機(jī)柜數(shù)量構(gòu)建超節(jié)點(diǎn),突破傳統(tǒng)互連方式下超節(jié)點(diǎn)的物理限制。
光躍LightSphere X全球首創(chuàng)的分布式光交換(dOCS)技術(shù)則進(jìn)一步提升了超節(jié)點(diǎn)的靈活度和系統(tǒng)可擴(kuò)展性,從而達(dá)到提升系統(tǒng)性價(jià)比的目的,還能按模型算力需求動(dòng)態(tài)調(diào)整超節(jié)點(diǎn)規(guī)模,光躍LightSphere X將實(shí)現(xiàn)2千卡規(guī)模部署。
據(jù)悉,光躍LightSphere X依托上海儀電算力底座,集合國(guó)內(nèi)智算領(lǐng)域頭部企業(yè),共建了“光芯片-GPU-服務(wù)器-算力集群-智算云平臺(tái)”閉環(huán),打造了開(kāi)放共享的光電融合算力生態(tài)體系。上海儀電(集團(tuán))有限公司是上海市國(guó)資委所屬的產(chǎn)業(yè)發(fā)展類(lèi)集團(tuán)、上海市公共算力服務(wù)平臺(tái)核心建設(shè)單位和智算自主可控國(guó)產(chǎn)軟硬件生態(tài)“鏈主”企業(yè)。
值得關(guān)注的是,曦智科技創(chuàng)新分布式光交換模組,可以支持集群內(nèi)GPU互聯(lián)拓?fù)涞撵`活切換,并在特殊情況下,可以利用冗余迅速重組超節(jié)點(diǎn)網(wǎng)絡(luò),顯著提升大模型訓(xùn)推能力,極大的拓展了集群的應(yīng)用場(chǎng)景。此外,曦智科技與沐曦合作的光互連電交換超節(jié)點(diǎn)方案也首次公開(kāi)亮相。該方案采用線性直驅(qū)光互連技術(shù),具有低延時(shí)、高帶寬、低功耗的特點(diǎn),并支持長(zhǎng)距離傳輸,突破跨機(jī)柜連接的限制,支持8臺(tái)標(biāo)準(zhǔn)服務(wù)器共64張xPU卡的高速互連,為大模型訓(xùn)練及推理提供更靈活、更高效的并行策略支持,從而提升集群性能。
中興通訊表示,公司將堅(jiān)持智算戰(zhàn)略主航道持續(xù)深化AI領(lǐng)域投入,基于自主創(chuàng)新實(shí)力和全棧智算解決方案,助力全球運(yùn)營(yíng)商和合作伙伴構(gòu)建開(kāi)放、互利的AI新生態(tài)。
本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來(lái)源。微信號(hào)zy1052625525。需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱zhangying@huaqiu.com。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5480瀏覽量
108958 -
gpu
+關(guān)注
關(guān)注
28文章
5076瀏覽量
134285 -
中興通訊
+關(guān)注
關(guān)注
7文章
2119瀏覽量
57923
發(fā)布評(píng)論請(qǐng)先 登錄
最全!一文看懂華為昇騰芯片和超節(jié)點(diǎn)最新演進(jìn)路線
中科曙光scaleX640超節(jié)點(diǎn)亮相2025世界計(jì)算大會(huì)
昆侖芯超節(jié)點(diǎn)亮相,單卡性能提升95%
華為發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)和集群
華為超節(jié)點(diǎn)互聯(lián)技術(shù)引領(lǐng)AI基礎(chǔ)設(shè)施新范式
商湯科技聯(lián)合華為昇騰實(shí)現(xiàn)超節(jié)點(diǎn)適配多項(xiàng)創(chuàng)新
面向萬(wàn)億級(jí)參數(shù)大模型,“超節(jié)點(diǎn)”涌現(xiàn)
中國(guó)首條"算力光軌"通車(chē)!國(guó)內(nèi)首個(gè)分布式光互連光交換超節(jié)點(diǎn)發(fā)布
上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊發(fā)布國(guó)內(nèi)首個(gè)光互連光交換GPU超節(jié)點(diǎn)——光躍LightSphere X
華為開(kāi)發(fā)者大會(huì)2025(HDC 2025)亮點(diǎn):華為云發(fā)布盤(pán)古大模型5.5 宣布新一代昇騰AI云服務(wù)上線
有關(guān) AI 算力,華為昇騰刷新行業(yè)記錄
華為云黃瑾:昇騰云CloudMatrix 384超節(jié)點(diǎn)六大科技創(chuàng)新,定義下一代AI基礎(chǔ)設(shè)施
華為云超節(jié)點(diǎn)創(chuàng)新算力基礎(chǔ)設(shè)施,推動(dòng)千行萬(wàn)業(yè)AI應(yīng)用開(kāi)發(fā)落地
AI 新品首秀 超云重磅亮相 2024 英特爾新質(zhì)生產(chǎn)力技術(shù)生態(tài)大會(huì)

重磅!華為昇騰384超節(jié)點(diǎn)真機(jī)登場(chǎng),中興攜廠商首秀GPU超節(jié)點(diǎn)實(shí)力
評(píng)論