12月20日,在首屆MUSA開發者大會上,摩爾線程創始人、董事長兼CEO張建中發表主題演講,系統展示了以自主MUSA統一架構為核心的全棧創新成果,全面展現公司在技術和生態上的關鍵突破與前瞻布局。
本次發布的核心成果包括:
新架構“花港”亮相:
發布全功能GPU架構“花港”,支持FP4到FP64的全精度計算,密度提升50%,效能提升10倍。未來將基于該架構推出高性能AI訓推一體“華山”芯片與專攻高性能圖形渲染的“廬山”芯片。
“夸娥”萬卡高效訓練:
發布夸娥萬卡智算集群,展示了其支撐萬億參數模型訓練的工程化能力與可靠性,在多項關鍵精度指標上達到國際主流水平。
推理性能實現飛躍:
摩爾線程聯合硅基流動,在DeepSeek R1 671B全量模型上實現性能突破,MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,樹立國產推理性能新標桿。
超節點架構前瞻:
分享面向下一代超大規模智算中心的MTT C256超節點架構規劃,著眼高密硬件架構,將實現極致智算性能。
全新個人智算平臺:
正式發布搭載智能SoC芯片“長江”的AI算力本MTT AIBOOK,賦能“摩爾學院”20萬開發者與學習者。
圖形進化與前沿探索:
實現硬件級光線追蹤加速與自研AI生成式渲染技術,具身智能、科學智能(AI4S)、AI for 6G等前沿領域的深度布局,進一步印證了全功能GPU技術路線的廣度與面向未來的可擴展性。
戰略基石:
MUSA統一架構的進化與開放
MUSA(Meta-computing Unified System Architecture)是摩爾線程自主研發的元計算統一計算架構,覆蓋從芯片架構、指令集、編程模型到軟件運行庫及驅動程序框架等的全棧技術體系。
MUSA不僅完整定義了從芯片設計到軟件生態的統一技術標準,更代表了公司堅持底層創新、踐行長期主義的戰略核心,并為全功能GPU奠定了堅實的技術根基,可高效支持AI計算、圖形渲染、物理仿真和科學計算、超高清視頻編解碼等全場景高性能計算。
歷經五年深度研發與持續迭代,MUSA實現了軟件性能的指數級跨越。全新升級的MUSA 5.0標志著架構步入成熟新階段,在全棧統一性、極致效能與生態開放性上取得關鍵突破。
編程生態全面升級:
原生MUSA C,深度兼容TileLang、Triton 等編程語言,為開發者提供靈活高效的全棧開發體驗。
計算效能極致優化:
核心計算庫muDNN實現GEMM/FlashAttention效率超98%,通信效率達97%,編譯器性能提升3倍,并集成高性能算子庫,顯著加速訓練與推理全流程。
開源生態持續擴大:
計劃逐步開源計算加速庫、通信庫及系統管理框架在內的核心組件,向開發者社區開放深度優化的底層能力。
前沿特性拓展邊界:
即將推出兼容跨代GPU指令架構的中間語言MTX、面向渲染+AI融合計算的編程語言muLang、量子計算融合框架MUSA-Q,以及計算光刻庫muLitho,持續拓展全功能GPU的算力邊界。
硬件核心:
“花港”新架構與技術路線圖
基于MUSA統一體系,摩爾線程揭曉新一代全功能GPU架構“花港”。該架構在計算密度、能效、精度支持、互聯能力及圖形技術等方面實現全面突破,其核心特性包括:
計算性能顯著提升:
基于新一代指令集,算力密度提升50%,能效大幅優化;支持從FP4到FP64的全精度端到端計算,新增MTFP6/MTFP4及混合低精度支持。
異步編程與超大規模互聯:
集成新一代異步編程模型,優化任務調度與并行機制;通過自研MTLink高速互聯技術,支持十萬卡以上規模智算集群擴展。
圖形與AI深度融合:
自研AI生成式渲染架構,增強硬件光線追蹤加速引擎,完整支持DirectX 12 Ultimate,實現圖形渲染與智能計算的高度協同。
全棧自研與安全可信:
架構基于全棧自主研發,擁有扎實的專利壁壘(*截至2025年6月30日,公司累計授權專利514項,其中發明專利468項),具備全棧自研與自主可控的核心能力。通過四層硬件安全架構,提供從芯片到系統的可驗證安全守護。
基于“花港”架構,摩爾線程公布了未來將發布的兩款芯片技術路線:
“華山”專注AI訓推一體與超大規模智能計算。集成新一代異步編程與全精度張量計算單元,支持從FP4至FP64的全精度計算,為萬卡級智算集群提供穩定高效的算力支撐,是構建下一代“AI工廠”的堅實底座。
“廬山”專攻高性能圖形渲染。性能實現全面跨越:幾何處理性能提升16倍,AI計算性能提升64倍,光線追蹤性能提升50倍,并顯著增強紋理填充、原子訪存能力及顯存容量。集成AI生成式渲染、UNITE渲染架構及全新硬件光追引擎,為3A游戲、高端圖形創作提供強大算力支持。
基礎設施:
夸娥萬卡集群,樹立國產智算效率標桿
大會重磅發布了夸娥萬卡智算集群。該集群具備全精度、全功能通用計算能力,在萬卡規模下實現高效穩定的AI訓練與推理。其核心突破包括:浮點運算能力達到10Exa-Flops,訓練算力利用率(MFU)在Dense大模型上達60%,MOE大模型上達40%,有效訓練時間占比超過90%,訓練線性擴展效率達95%,與國際主流生態高度兼容,并在多項指標上具備顯著能效優勢。
在訓練側,基于原生FP8能力完整復現頂尖大模型訓練流程,并在多項關鍵精度指標上達到國際主流水平。技術層面實現關鍵優化:Flash Attention算力利用率超95%,并突破FP8累加精度等關鍵技術瓶頸,充分釋放國產GPU在大模型訓練中的性能潛力。
在推理側,摩爾線程聯合硅基流動,經過系統級工程優化與FP8精度加速,在DeepSeek R1 671B全量模型上實現性能突破:MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,樹立國產推理性能新標桿。
面向未來,發布了MTT C256超節點的架構規劃。該產品采用計算與交換一體化的高密設計,旨在系統性提升萬卡集群的訓練效能與推理能力,為下一代超大規模智算中心構建兼具超高密度與極致能效的硬件基石。
邁向物理AI:
圖形技術持續進化,前瞻布局未來計算
在圖形計算領域,摩爾線程持續推動國產GPU向兼容性更廣、技術更深的方向發展。其產品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流圖形與計算API,并與國產主流CPU及操作系統完成了全棧適配,持續擴展游戲及專業應用的兼容覆蓋。公司同時宣布,即將完整支持DirectX 12 Ultimate,進一步接軌行業頂級圖形標準。
在核心渲染技術上,摩爾線程率先擁抱“圖形+AI”范式革命,實現兩項關鍵突破:
邁入實時光追時代:基于“花港”架構的硬件光線追蹤加速引擎,可實現對DirectX Raytracing (DXR)的支持,使實時、逼真的光影效果在國產GPU上成為可能。
定義AI生成式渲染(AGR):推出全自研MTAGR 1.0技術,推動渲染技術范式從“計算”走向“生成”,為下一代數字內容創作及數字孿生等場景構建國產技術基座。
面向更廣闊的未來計算場景,摩爾線程已展開前瞻性布局:
具身智能全棧賦能:發布了MT Lambda具身智能仿真訓練平臺,深度融合物理、渲染與AI三大引擎,構建了開發、仿真、訓練的高效統一環境。推出基于智能SoC芯片“長江”、AI模組MTT E300和夸娥智算集群“端云結合”的MT Robot具身智能解決方案,并宣布將于2026年第一季度開源關鍵仿真加速組件Mujoco-warp-MUSA,以開放協作助力機器人產業研發效率提升。
前沿融合計算探索:MUSA生態已與合作伙伴在科學智能(AI for Science)、量子科技、AI for 6G等前沿交叉領域展開探索工作,持續拓展全功能GPU作為通用算力底座的技術邊界與應用價值。
生態加速:
全面賦能開發者,發布個人AI算力平臺
生態建設是GPU行業的核心壁壘與價值所在,摩爾線程構建了從硬件工具、算力支撐到人才培養的賦能體系。
深化人才培養,建設MUSA生態樞紐:以摩爾學院為平臺,摩爾線程已構建起產教融合的開發者成長體系,該平臺匯聚近20萬名開發者與學習者,并通過“國產計算生態與AI教育共建行動”將前沿技術與產業實踐帶入全國200多所高校,吸引超10萬名學子參與。本次大會宣布建設MUSA生態中心,同時發布MUSA開發者計劃,旨在為從AI學習探索到科研創新的各階段創新者,提供算力支持與技術賦能。
發布AI算力本,提供“開箱即用”的開發體驗:MTT AIBOOK是專為AI學習與開發者打造的個人智算平臺。它搭載自研智能SoC芯片“長江”,提供50TOPS異構AI算力,支持混合精度計算。運行基于Linux內核的MT AIOS操作系統,具備多系統兼容能力,并預置完整AI開發環境與工具鏈。產品內置智能體“小麥”及豐富AI應用,提供開箱即用的一站式AI體驗。
大會同時預告了基于“長江”SoC打造的迷你型計算設備MTT AICube,進一步豐富端側計算產品形態。
結語:
構筑自主基座,共赴智能未來
MDC 2025展示了從統一架構到核心芯片,從超大規模基礎設施到開發者終端的技術全景,這不僅是一次全功能GPU技術路線的系統呈現,更是摩爾線程對自主計算未來的堅定承諾。
展望未來,摩爾線程將以MUSA為核心,堅持開放生態,與全球開發者及伙伴攜手,共同構建下一代的智能計算體系,賦能千行百業,邁向智能新紀元。
關于摩爾線程
摩爾線程以全功能GPU為核心,致力于向全球提供加速計算的基礎設施和一站式解決方案,為各行各業的數智化轉型提供強大的AI計算支持。
我們的目標是成為具備國際競爭力的GPU領軍企業,為融合人工智能和數字孿生的數智世界打造先進的加速計算平臺。我們的愿景是為美好世界加速。
-
gpu
+關注
關注
28文章
5237瀏覽量
135920 -
開發者
+關注
關注
1文章
777瀏覽量
18050 -
摩爾線程
+關注
關注
2文章
282瀏覽量
6591 -
DeepSeek
+關注
關注
2文章
837瀏覽量
3360
原文標題:MDC 2025|摩爾線程CEO主題演講全解析,發布多項關鍵技術進展
文章出處:【微信號:moorethreads,微信公眾號:摩爾線程】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
摩爾線程深耕國產算力生態,共促科技和產業融合創新
摩爾線程發布圖形顯卡驅動程序v330.140
全棧國產AI Coding上線:摩爾線程+硅基流動+智譜,強強聯合!
算力即國力!摩爾線程架構/芯片/超節點/萬卡集群四連發,助力打造AI國之重器
摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰賽銀獎
MDC 2025 摩爾線程首屆MUSA開發者大會成功舉辦,加速構建國產GPU生態
摩爾線程公布全功能GPU架構路線圖:以“花港”新架構與萬卡訓練集群,開啟自主算力新時代
摩爾線程亮相GOTC 2025全球開源技術峰會
摩爾線程WAIC2025亮相:以“AI工廠”理念重塑算力生態 全棧產品開啟智能新紀元
摩爾線程吳慶詳解 MUSA 軟件棧:以技術創新釋放 KUAE 集群潛能,引領 GPU 計算新高度?
摩爾線程亮相WAIC 2025:以“AI工廠”理念驅動算力進化,全棧AI應用賦能千行百業
摩爾線程“AI工廠”:五大核心技術支撐,打造大模型訓練超級工廠
摩爾線程“AI工廠”:以系統級創新定義新一代AI基礎設施
摩爾線程在MDC 2025重磅發布全棧創新成果
評論