電子發(fā)燒友網(wǎng)綜合報(bào)道 近日,在光合組織2025人工智能創(chuàng)新大會(huì)(HAIC 2025)上,中科曙光正式發(fā)布并展出了全球領(lǐng)先的ScaleX萬卡超集群。這一國(guó)產(chǎn)萬卡級(jí)AI集群系統(tǒng)首次以真機(jī)形式亮相,標(biāo)志著中國(guó)在高性能計(jì)算領(lǐng)域的又一次重大突破。
中科曙光高級(jí)副總裁李斌表示,面對(duì)人工智能基礎(chǔ)設(shè)施對(duì)性能、效率、可靠性、可擴(kuò)展性等方面的極致需求,ScaleX萬卡超集群在超節(jié)點(diǎn)架構(gòu)、高速互連網(wǎng)絡(luò)、存儲(chǔ)性能優(yōu)化、系統(tǒng)管理調(diào)度等方面實(shí)現(xiàn)了多項(xiàng)創(chuàng)新突破,部分技術(shù)與能力已超越海外同類產(chǎn)品研發(fā)路線圖的2027年NVL576里程節(jié)點(diǎn)。
從核心參數(shù)來看,該超節(jié)點(diǎn)(Super Pod)包含576顆Rubin Ultra GPU(代號(hào)“Kyber”),設(shè)計(jì)目標(biāo)為實(shí)現(xiàn)15 EFLOPS(FP4推理)與5 EFLOPS(FP8訓(xùn)練)算力,將是GB 300 NVL72(Blackwell架構(gòu)代表性產(chǎn)品)的14倍。
公開報(bào)道顯示,作為系統(tǒng)計(jì)算核心,Rubin Ultra GPU由兩塊掩模尺寸的GPU組成,擁有288GB HBM4內(nèi)存,F(xiàn)P4峰值推理能力可達(dá)50 PFLOPS,預(yù)計(jì)2026年下半年上市。得益于這一強(qiáng)勁性能,NVL576可單機(jī)柜完成萬億參數(shù)模型(如GPT-4級(jí)別)訓(xùn)練,且訓(xùn)練周期較此前大幅縮短,預(yù)計(jì)將從數(shù)月縮減為數(shù)周。
優(yōu)勢(shì)1:全球首創(chuàng)單機(jī)柜級(jí)640卡超節(jié)點(diǎn)。ScaleX萬卡超集群由16個(gè)曙光ScaleX 640超節(jié)點(diǎn)通過ScaleFabric高速網(wǎng)絡(luò)互連而成,可實(shí)現(xiàn)10240塊AI加速卡部署,總算力規(guī)模超5 EFLOPS。作為全球首個(gè)單機(jī)柜級(jí)640卡超節(jié)點(diǎn),ScaleX 640采用超高密度刀片、浸沒相變液冷等技術(shù),將單機(jī)柜算力密度提升20倍,PUE值低至1.04。
優(yōu)勢(shì)2:自主研發(fā)原生RDMA高速網(wǎng)絡(luò)。曙光ScaleFabric網(wǎng)絡(luò)基于國(guó)內(nèi)首款400G類InfiniBand的原生RDMA網(wǎng)卡與交換芯片,可實(shí)現(xiàn)400Gb/s超高帶寬、低于1微秒端側(cè)通信延遲,超節(jié)點(diǎn)間通信性能達(dá)到業(yè)內(nèi)領(lǐng)先水平,能充分釋放萬卡超集群算力,且可將超集群規(guī)模輕松擴(kuò)展至10萬卡以上。相較于傳統(tǒng)IB網(wǎng)絡(luò),其性能提升2.33倍,同時(shí)網(wǎng)絡(luò)總體成本降低30%。
優(yōu)勢(shì)3:存、算、傳緊耦合深度優(yōu)化。通過“超級(jí)隧道”、AI數(shù)據(jù)加速等設(shè)計(jì),實(shí)現(xiàn)從芯片級(jí)、系統(tǒng)級(jí)到應(yīng)用級(jí)的三級(jí)數(shù)據(jù)傳輸協(xié)同優(yōu)化,使存力平臺(tái)高效應(yīng)對(duì)大模型訓(xùn)練時(shí)萬卡并發(fā)讀寫帶寬的極致需求,提升高通量AI推理的響應(yīng)速度與結(jié)果精準(zhǔn)度,并可將AI加速卡資源利用率提高55%。
優(yōu)勢(shì)4:超集群數(shù)字孿生與智能調(diào)度。通過物理集群數(shù)字孿生,實(shí)現(xiàn)故障定位、修復(fù)等全流程可視化智能管理;智能化運(yùn)維平臺(tái)可支撐集群長(zhǎng)期可用性達(dá)99.99%;智能調(diào)度引擎可管理萬級(jí)節(jié)點(diǎn)、服務(wù)十萬級(jí)用戶,支持每秒萬級(jí)作業(yè)調(diào)度。
除技術(shù)突破外,ScaleX萬卡超集群的發(fā)布更標(biāo)志著國(guó)產(chǎn)AI算力生態(tài)從“單點(diǎn)突圍”邁向“生態(tài)共進(jìn)”的關(guān)鍵轉(zhuǎn)折。2025年9月,中科曙光已協(xié)同20多家AI產(chǎn)業(yè)鏈企業(yè)推出“AI計(jì)算開放架構(gòu)”,通過共享關(guān)鍵共性技術(shù),推進(jìn)智算集群的協(xié)同創(chuàng)新。
在中科曙光看來,相較于技術(shù)、產(chǎn)品、解決方案層面的突破,整個(gè)智算生態(tài)系統(tǒng)的構(gòu)建更為重要。縱觀歷史上關(guān)鍵技術(shù)的普及軌跡,主要有兩條可選路徑:一是依靠少數(shù)巨頭打造的封閉式全棧垂直體系,二是基于開放架構(gòu)、由產(chǎn)業(yè)鏈各環(huán)節(jié)共同參與的協(xié)作生態(tài)。兩者并非非此即彼的替代關(guān)系,但前者往往占據(jù)強(qiáng)勢(shì)地位,后者要贏得發(fā)展空間必須付出巨大努力。
對(duì)國(guó)內(nèi)智算產(chǎn)業(yè)而言,當(dāng)前面臨的挑戰(zhàn)紛繁復(fù)雜,亟需整合產(chǎn)業(yè)鏈上的大量企業(yè),實(shí)現(xiàn)真正的跨層協(xié)作優(yōu)化,進(jìn)而打造開放式、標(biāo)準(zhǔn)化、高效率的集群算力,才能在日趨白熱化的競(jìng)爭(zhēng)中掌握主動(dòng)權(quán)。不過,這條道路充滿荊棘,橫亙?cè)谇胺降募夹g(shù)墻與生態(tài)墻極難跨越,市場(chǎng)呼喚開路先鋒的引領(lǐng)與垂范。
中科曙光高級(jí)副總裁李斌表示,面對(duì)人工智能基礎(chǔ)設(shè)施對(duì)性能、效率、可靠性、可擴(kuò)展性等方面的極致需求,ScaleX萬卡超集群在超節(jié)點(diǎn)架構(gòu)、高速互連網(wǎng)絡(luò)、存儲(chǔ)性能優(yōu)化、系統(tǒng)管理調(diào)度等方面實(shí)現(xiàn)了多項(xiàng)創(chuàng)新突破,部分技術(shù)與能力已超越海外同類產(chǎn)品研發(fā)路線圖的2027年NVL576里程節(jié)點(diǎn)。
NVL576:下一個(gè)算力里程節(jié)點(diǎn)
NVL576是英偉達(dá)基于下一代Rubin Ultra架構(gòu)打造的機(jī)柜級(jí)AI超算系統(tǒng),預(yù)計(jì)2027年下半年正式亮相,定位“AI工廠”核心心臟,主要面向萬億參數(shù)級(jí)大模型訓(xùn)練與推理。從核心參數(shù)來看,該超節(jié)點(diǎn)(Super Pod)包含576顆Rubin Ultra GPU(代號(hào)“Kyber”),設(shè)計(jì)目標(biāo)為實(shí)現(xiàn)15 EFLOPS(FP4推理)與5 EFLOPS(FP8訓(xùn)練)算力,將是GB 300 NVL72(Blackwell架構(gòu)代表性產(chǎn)品)的14倍。
公開報(bào)道顯示,作為系統(tǒng)計(jì)算核心,Rubin Ultra GPU由兩塊掩模尺寸的GPU組成,擁有288GB HBM4內(nèi)存,F(xiàn)P4峰值推理能力可達(dá)50 PFLOPS,預(yù)計(jì)2026年下半年上市。得益于這一強(qiáng)勁性能,NVL576可單機(jī)柜完成萬億參數(shù)模型(如GPT-4級(jí)別)訓(xùn)練,且訓(xùn)練周期較此前大幅縮短,預(yù)計(jì)將從數(shù)月縮減為數(shù)周。
ScaleX萬卡超集群:部分技術(shù)與能力已超越NVL576
在AI大模型參數(shù)規(guī)模從千億向萬億躍遷的當(dāng)下,算力規(guī)模與效率成為制約產(chǎn)業(yè)發(fā)展的關(guān)鍵因素。高端AI硬件供給受限、軟硬件生態(tài)割裂、算力成本高昂等問題,曾如“性能墻”一般阻礙中國(guó)AI產(chǎn)業(yè)升級(jí)。中科曙光ScaleX萬卡超集群的亮相,首次展示了國(guó)產(chǎn)AI計(jì)算在系統(tǒng)級(jí)架構(gòu)上的突破。該集群憑借四大優(yōu)勢(shì),實(shí)現(xiàn)了算力密度、傳輸效率、智能調(diào)度等方面的全面提升。優(yōu)勢(shì)1:全球首創(chuàng)單機(jī)柜級(jí)640卡超節(jié)點(diǎn)。ScaleX萬卡超集群由16個(gè)曙光ScaleX 640超節(jié)點(diǎn)通過ScaleFabric高速網(wǎng)絡(luò)互連而成,可實(shí)現(xiàn)10240塊AI加速卡部署,總算力規(guī)模超5 EFLOPS。作為全球首個(gè)單機(jī)柜級(jí)640卡超節(jié)點(diǎn),ScaleX 640采用超高密度刀片、浸沒相變液冷等技術(shù),將單機(jī)柜算力密度提升20倍,PUE值低至1.04。
優(yōu)勢(shì)2:自主研發(fā)原生RDMA高速網(wǎng)絡(luò)。曙光ScaleFabric網(wǎng)絡(luò)基于國(guó)內(nèi)首款400G類InfiniBand的原生RDMA網(wǎng)卡與交換芯片,可實(shí)現(xiàn)400Gb/s超高帶寬、低于1微秒端側(cè)通信延遲,超節(jié)點(diǎn)間通信性能達(dá)到業(yè)內(nèi)領(lǐng)先水平,能充分釋放萬卡超集群算力,且可將超集群規(guī)模輕松擴(kuò)展至10萬卡以上。相較于傳統(tǒng)IB網(wǎng)絡(luò),其性能提升2.33倍,同時(shí)網(wǎng)絡(luò)總體成本降低30%。
優(yōu)勢(shì)3:存、算、傳緊耦合深度優(yōu)化。通過“超級(jí)隧道”、AI數(shù)據(jù)加速等設(shè)計(jì),實(shí)現(xiàn)從芯片級(jí)、系統(tǒng)級(jí)到應(yīng)用級(jí)的三級(jí)數(shù)據(jù)傳輸協(xié)同優(yōu)化,使存力平臺(tái)高效應(yīng)對(duì)大模型訓(xùn)練時(shí)萬卡并發(fā)讀寫帶寬的極致需求,提升高通量AI推理的響應(yīng)速度與結(jié)果精準(zhǔn)度,并可將AI加速卡資源利用率提高55%。
優(yōu)勢(shì)4:超集群數(shù)字孿生與智能調(diào)度。通過物理集群數(shù)字孿生,實(shí)現(xiàn)故障定位、修復(fù)等全流程可視化智能管理;智能化運(yùn)維平臺(tái)可支撐集群長(zhǎng)期可用性達(dá)99.99%;智能調(diào)度引擎可管理萬級(jí)節(jié)點(diǎn)、服務(wù)十萬級(jí)用戶,支持每秒萬級(jí)作業(yè)調(diào)度。
除技術(shù)突破外,ScaleX萬卡超集群的發(fā)布更標(biāo)志著國(guó)產(chǎn)AI算力生態(tài)從“單點(diǎn)突圍”邁向“生態(tài)共進(jìn)”的關(guān)鍵轉(zhuǎn)折。2025年9月,中科曙光已協(xié)同20多家AI產(chǎn)業(yè)鏈企業(yè)推出“AI計(jì)算開放架構(gòu)”,通過共享關(guān)鍵共性技術(shù),推進(jìn)智算集群的協(xié)同創(chuàng)新。
在中科曙光看來,相較于技術(shù)、產(chǎn)品、解決方案層面的突破,整個(gè)智算生態(tài)系統(tǒng)的構(gòu)建更為重要。縱觀歷史上關(guān)鍵技術(shù)的普及軌跡,主要有兩條可選路徑:一是依靠少數(shù)巨頭打造的封閉式全棧垂直體系,二是基于開放架構(gòu)、由產(chǎn)業(yè)鏈各環(huán)節(jié)共同參與的協(xié)作生態(tài)。兩者并非非此即彼的替代關(guān)系,但前者往往占據(jù)強(qiáng)勢(shì)地位,后者要贏得發(fā)展空間必須付出巨大努力。
對(duì)國(guó)內(nèi)智算產(chǎn)業(yè)而言,當(dāng)前面臨的挑戰(zhàn)紛繁復(fù)雜,亟需整合產(chǎn)業(yè)鏈上的大量企業(yè),實(shí)現(xiàn)真正的跨層協(xié)作優(yōu)化,進(jìn)而打造開放式、標(biāo)準(zhǔn)化、高效率的集群算力,才能在日趨白熱化的競(jìng)爭(zhēng)中掌握主動(dòng)權(quán)。不過,這條道路充滿荊棘,橫亙?cè)谇胺降募夹g(shù)墻與生態(tài)墻極難跨越,市場(chǎng)呼喚開路先鋒的引領(lǐng)與垂范。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
華為領(lǐng)銜,三劍客入局!十萬卡智算集群落地,國(guó)產(chǎn)算力芯片強(qiáng)勢(shì)崛起
中國(guó)移動(dòng)宣布,將持續(xù)加大對(duì)人工智能領(lǐng)域的投入力度,總體投入翻一番,建成國(guó)內(nèi)規(guī)模最大、技術(shù)領(lǐng)先的智算基礎(chǔ)設(shè)施,探索十萬卡智算集群建設(shè),全國(guó)產(chǎn)智
中科曙光3套scaleX萬卡超集群落地國(guó)家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)
2月5日,由中科曙光提供的3套萬卡超集群系統(tǒng)在國(guó)家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)同時(shí)上線試運(yùn)行,成為全國(guó)首個(gè)實(shí)現(xiàn)3
中科曙光scaleX萬卡超集群重塑超大規(guī)模算力基礎(chǔ)設(shè)施
在“人工智能+”行動(dòng)深入推進(jìn)的當(dāng)下,算力基礎(chǔ)設(shè)施已成為國(guó)家戰(zhàn)略競(jìng)爭(zhēng)力的核心,而超大規(guī)模集群的運(yùn)維管控難題卻日益凸顯。中科曙光scaleX萬
中科曙光scaleX萬卡超集群背后的持續(xù)創(chuàng)新
智算集群的發(fā)展浪潮正以超乎想象的速度襲來,未來五年,十萬卡級(jí)的算力集群將成為標(biāo)配。但一個(gè)核心挑戰(zhàn)
算力高達(dá) 1570 TOPS!支持多硬盤的高算力服務(wù)器 CSB2-N10
口和1個(gè)千兆管理口,可擴(kuò)展6個(gè)SATA3.0硬盤。配套智能管理系統(tǒng),標(biāo)準(zhǔn)的2U機(jī)架服務(wù)器機(jī)箱設(shè)計(jì)。算力高達(dá)1570TOPS服務(wù)器內(nèi)置10個(gè)分
墨芯人工智能千卡集群正式簽約入駐新疆算力中心
在“東數(shù)西算”國(guó)家工程全面推進(jìn)的大背景下,新疆憑借其豐富的清潔能源和獨(dú)特的區(qū)位優(yōu)勢(shì),正迅速崛起為國(guó)家級(jí)算力網(wǎng)絡(luò)的關(guān)鍵樞紐。近日,墨芯人工智能(以下簡(jiǎn)稱“墨芯”)的千卡
部分能力超越2027年NVL576,中科曙光發(fā)布scaleX萬卡超集群
系統(tǒng)首次以真機(jī)形式亮相。 “scaleX萬卡超集群,是曙光發(fā)揮大型計(jì)算機(jī)系統(tǒng)研制經(jīng)驗(yàn)優(yōu)勢(shì),面向萬億參數(shù)大模型、科學(xué)智能等復(fù)雜任務(wù)場(chǎng)景打造的大規(guī)模智能算
發(fā)表于 12-18 18:30
?1095次閱讀
壁仞科技聯(lián)合三方打造國(guó)產(chǎn)算力集群落地
近日,由浙江聯(lián)通、壁仞科技、中興通訊、優(yōu)云科技四方聯(lián)合打造的國(guó)產(chǎn)算力集群,在浙江烏鎮(zhèn)智算中心正式點(diǎn)亮。該
從萬卡集群到十萬卡集群,燧原科技始終踐行算力普惠
健康、教育等垂直領(lǐng)域,對(duì)算力設(shè)施有著更加廣泛的需求,包括智算中心和訓(xùn)推一體機(jī)等。 ? 在 2025 世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2025)上,作為國(guó)產(chǎn)人工智
發(fā)表于 07-30 09:54
?4514次閱讀
一文看懂AI算力集群
最近這幾年,AI浪潮席卷全球,成為整個(gè)社會(huì)的關(guān)注焦點(diǎn)。大家在討論AI的時(shí)候,經(jīng)常會(huì)提到AI算力集群。AI的三要素,是算力、算法和數(shù)據(jù)。而AI
燧原科技國(guó)產(chǎn)萬卡集群通過中國(guó)信通院權(quán)威認(rèn)證
近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱“中國(guó)信通院”)成功召開萬卡智算集群服務(wù)推進(jìn)方陣年中總交流會(huì)。會(huì)議期間,中國(guó)信通院重磅發(fā)布了首批《大規(guī)模智算
熱插拔算力集群
能力? 服務(wù)器節(jié)點(diǎn)熱插拔?:集群服務(wù)器支持在線更換計(jì)算節(jié)點(diǎn)(如2U服務(wù)器容納12個(gè)熱插拔AI節(jié)點(diǎn),單節(jié)點(diǎn)集成5個(gè)算力卡)。 GPU/
DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用
力集群的部署過程中,帶寬瓶頸成為制約算力發(fā)揮的關(guān)鍵因素,而光模塊的速率躍升成為突破這一瓶頸的核心驅(qū)動(dòng)力。
光模塊速率躍升
隨著算
發(fā)表于 03-25 12:00
總算力5EFLOPS!可擴(kuò)展至10萬卡,國(guó)產(chǎn)算力集群部分性能超越NVL576
評(píng)論