今日,摩爾線程在其旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,成功實(shí)現(xiàn)了對(duì)智譜新一代旗艦?zāi)P虶LM-5.1的Day-0極速適配,提供推理部署和訓(xùn)練復(fù)現(xiàn)全流程支持。
依托MUSA軟件棧強(qiáng)大的生態(tài)兼容性,摩爾線程技術(shù)團(tuán)隊(duì)基于高性能 SGLang-MUSA推理引擎及TileLang-MUSA算子編程語(yǔ)言,采用PD分離架構(gòu)完成深度調(diào)優(yōu),在 MTT S5000 上實(shí)現(xiàn) GLM-5.1 的高效、高精度推理。這一成果彰顯了國(guó)產(chǎn)算力基礎(chǔ)設(shè)施對(duì)前沿 SOTA 模型的快速響應(yīng)能力,也為行業(yè)樹(shù)立了軟硬協(xié)同應(yīng)對(duì)復(fù)雜 AI 推理場(chǎng)景的新標(biāo)桿。GLM-5.1是智譜迄今最智能的旗艦?zāi)P停彩悄壳叭蜃顝?qiáng)的開(kāi)源模型。GLM-5.1大大提高了代碼能力,在最接近真實(shí)軟件開(kāi)發(fā)的SWE-bench Pro基準(zhǔn)測(cè)試中超過(guò)GPT-5.4、Claude Opus 4.6,刷新全球最佳成績(jī)。值得一提的是,在模型整體性能大幅提升外,GLM-5.1還在長(zhǎng)程任務(wù)(Long Horizon Task)處理能力上實(shí)現(xiàn)了顯著突破。和當(dāng)前分鐘級(jí)交互的模型不同,GLM-5.1能夠在一次任務(wù)中獨(dú)立、持續(xù)工作超過(guò)8小時(shí),期間自主規(guī)劃、執(zhí)行、自我進(jìn)化,最終交付完整的工程級(jí)成果。

針對(duì)GLM-5.1的長(zhǎng)程任務(wù)與代碼生成特性,摩爾線程基于自研MUSA架構(gòu)與SGLang-MUSA、TileLang-MUSA等關(guān)鍵技術(shù),完成了系統(tǒng)性的算子適配與推理性能調(diào)優(yōu)。MTT S5000單卡AI算力(稠密)可達(dá)1000 TFLOPS,支持FP8到FP64全精度計(jì)算,其原生FP8加速顯著提升推理效率;結(jié)合高效KV Cache管理,有效支撐極長(zhǎng)上下文的顯存需求;同時(shí),PD分離架構(gòu)進(jìn)一步解耦Prefill與Decode階段,降低長(zhǎng)序列生成中的干擾,保障持續(xù)任務(wù)的高吞吐與低延遲。此外,MTT S5000提供784GB/s的卡間互聯(lián)帶寬,為大規(guī)模部署帶來(lái)彈性擴(kuò)展能力。通過(guò)軟硬協(xié)同優(yōu)化,MTT S5000能夠穩(wěn)定承接GLM-5.1的長(zhǎng)程任務(wù)吞吐與工程級(jí)代碼推理表現(xiàn)。
從GLM-4.7到GLM-5.1,摩爾線程已連續(xù)實(shí)現(xiàn)發(fā)布當(dāng)日極速適配。這既體現(xiàn)了MUSA架構(gòu)對(duì)主流AI生態(tài)的深度兼容,更標(biāo)志著國(guó)產(chǎn)全功能GPU已具備大模型“從適配到部署”的全鏈路支撐能力。摩爾線程將持續(xù)夯實(shí)算力底座,助力開(kāi)發(fā)者快速應(yīng)用前沿模型,共建更成熟的國(guó)產(chǎn)AI生態(tài)。
關(guān)于摩爾線程
摩爾線程以全功能GPU為核心,致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案,為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。我們的目標(biāo)是成為具備國(guó)際競(jìng)爭(zhēng)力的GPU領(lǐng)軍企業(yè),為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺(tái)。我們的愿景是為美好世界加速。
-
AI
+關(guān)注
關(guān)注
91文章
40642瀏覽量
302302 -
MUSA
+關(guān)注
關(guān)注
0文章
7瀏覽量
2180 -
摩爾線程
+關(guān)注
關(guān)注
2文章
283瀏覽量
6594 -
大模型
+關(guān)注
關(guān)注
2文章
3719瀏覽量
5250
原文標(biāo)題:Day-0支持|摩爾線程完成智譜GLM-5.1極速適配,高效支撐長(zhǎng)程任務(wù)與代碼生成
文章出處:【微信號(hào):moorethreads,微信公眾號(hào):摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
天數(shù)智芯通用GPU產(chǎn)品Day 0適配GLM-5.1開(kāi)源模型
摩爾線程MTT S5000全面適配Qwen3.5三款新模型
華為昇騰深度適配智譜AI全新開(kāi)源模型GLM-5
摩爾線程快速完成對(duì)Qwen3.5模型全面適配
Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配
寒武紀(jì)實(shí)現(xiàn)對(duì)GLM-5的Day 0適配
智譜AI正式上線并開(kāi)源全新一代大模型GLM-5
摩爾線程MTT S5000率先完成對(duì)GLM-5的適配
Day-0支持|摩爾線程MTT S5000率先完成對(duì)GLM-5的適配
摩爾線程正式開(kāi)源TileLang-MUSA項(xiàng)目
全棧國(guó)產(chǎn)AI Coding上線:摩爾線程+硅基流動(dòng)+智譜,強(qiáng)強(qiáng)聯(lián)合!
沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
Day-0支持|摩爾線程完成智譜GLM-5.1極速適配,高效支撐長(zhǎng)程任務(wù)與代碼生成
評(píng)論