2月11日晚間,智譜發(fā)布新一代旗艦?zāi)P虶LM-5,智譜稱,GLM-5在Coding與Agent能力上,取得開源SOTA表現(xiàn),在真實編程場景的使用體感逼近Claude Opus 4.5,擅長復(fù)雜系統(tǒng)工程與長程Agent任務(wù)。
智譜宣布,在全球權(quán)威的 Artificial Analysis 榜單中,GLM-5 位居全球第四、開源第一。GLM-5擁有744B(激活 40B)參數(shù)模型,預(yù)訓(xùn)練數(shù)據(jù)從 23T 提升至 28.5T,更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平。

GLM-5構(gòu)建全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強化學(xué)習(xí)任務(wù),提升強化學(xué)習(xí)后訓(xùn)練流程效率;提出異步智能體強化學(xué)習(xí)算法,使模型能夠持續(xù)從長程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。在稀疏注意力機制方面,GLM-5首次集成 DeepSeek Sparse Attention,在維持長文本效果無損的同時,大幅降低模型部署成本,提升 Token Efficiency。
智譜稱,GLM-5在編程能力上實現(xiàn)了對Claude Opus 4.5的對齊,在主流基準測試中取得開源模型SOTA分數(shù)。在SWE-bench-Verified和Terminal Bench 2.0中,GLM-5分別獲得77.8和56.2的開源模型SOTA分數(shù),性能超過Gemini 3 Pro。
GLM 系列模型受到全球開發(fā)者喜愛,在 GLM Coding Plan 全球爆量后,智譜公司不得不啟動限售活動。值得關(guān)注的是,GLM系列已經(jīng)完成已完成與華為昇騰、摩爾線程、寒武紀、昆侖芯、沐曦、燧原、海光等國產(chǎn)算力平臺的深度推理適配。通過底層算子優(yōu)化與硬件加速,GLM-5 在國產(chǎn)芯片集群上已經(jīng)實現(xiàn)高吞吐、低延遲的穩(wěn)定運行。

2月12日,MiniMax宣布上線最新旗艦編程模型MiniMax M2.5,目前在模型界面已經(jīng)可以選擇調(diào)用。據(jù)官方介紹,這是一個為智能體場景原生設(shè)計的生產(chǎn)級模型,其編程與智能體性能對標國際頂尖模型Claude Opus 4.6,支持PC、App、跨端應(yīng)用的全棧編程開發(fā),尤其適配 Excel高階處理、深度調(diào)研、PPT等生產(chǎn)力場景。M2.5模型激活參數(shù)量為10B,在顯存占用和推理能效比上有優(yōu)勢,推理速度超過國際頂尖模型。
預(yù)計2月中旬,DeepSeek將會發(fā)布新一代旗艦大模型V4,根據(jù)近期由創(chuàng)辦人梁文鋒署名的論文及業(yè)內(nèi)爆料,V4 將引入 mHC 與 Engram 兩項核心架構(gòu)創(chuàng)新,旨在顯著降低訓(xùn)練與推理成本,并在編程能力上挑戰(zhàn)目前的行業(yè)領(lǐng)導(dǎo)者。
在DeepSeek團隊在最新發(fā)布的論文中提出,當(dāng)前模型缺乏原生的知識查找機制,導(dǎo)致在處理靜態(tài)知識時仍需耗費昂貴的算力重復(fù)推導(dǎo)。為此,V4 預(yù)計將引入 Engram(條件記憶模塊),其設(shè)計理念是將“記憶”與“計算”解耦。
透過 Engram 技術(shù),模型能將靜態(tài)知識 (如實體、固定表達) 存儲在廉價的 DRAM 中,而非昂貴的 GPU 高帶寬內(nèi)存 (HBM)。當(dāng)模型需要推理時再快速查找,這將釋放 GPU 算力專注于復(fù)雜的動態(tài)計算。此外,另一項關(guān)鍵技術(shù) mHC(流形約束超連接) 則解決了超深層 Transformer 模型在訓(xùn)練時,信息流動瓶頸與不穩(wěn)定的問題,透過嚴苛的數(shù)學(xué)「護欄」,提升模型在數(shù)學(xué)推理等任務(wù)上的表現(xiàn)。
據(jù) 美國The Information 報導(dǎo),DeepSeek V4 的內(nèi)部初步測試顯示,其編程能力已超越市場上的頂級模型,包括 OpenAI 的 GPT 系列與 Anthropic 的 Claude。盡管 DeepSeek 先前推出的 V3.2 版本已在多項基準檢驗中超越部分競爭對手,但 V4 被視為核心架構(gòu)的正式繼任者,旨在進一步鞏固其作為高性能、低成本 AI 方案的地位。
當(dāng)下,大模型的競爭已經(jīng)從卷開源社區(qū),走向爭奪AI時代入口的升級階段。智譜此次發(fā)布新模型之后,大幅提價,說明國產(chǎn)模型的技術(shù)能力和市場競爭力明顯提升。在大模型從“技術(shù)競賽”轉(zhuǎn)向“商業(yè)兌現(xiàn)”的關(guān)鍵階段,誰能通過開源構(gòu)建起活躍的開發(fā)者生態(tài),并將其轉(zhuǎn)化為可持續(xù)的收入流,誰才真正贏得下一階段。
-
DeepSeek
+關(guān)注
關(guān)注
2文章
833瀏覽量
3199
發(fā)布評論請先 登錄
全球唯一?IBM更新量子計算路線圖:2029年交付!
投票總數(shù)超44萬!星特杯投票進入白熱化
天數(shù)智芯重磅公布四代架構(gòu)路線圖,對標英偉達
中國2040年汽車技術(shù)路線圖發(fā)布!內(nèi)燃機還能再戰(zhàn)15年?
納芯微參編節(jié)能與新能源汽車技術(shù)路線圖3.0正式發(fā)布
曦華科技參編節(jié)能與新能源汽車技術(shù)路線圖3.0正式發(fā)布
儲能戰(zhàn)略規(guī)劃:企業(yè)級儲能技術(shù)路線圖的制定方法與實踐指南
成都匯陽投資關(guān)于大模型白熱化,應(yīng)用加速分化
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】書籍介紹+第一章讀后心得
【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘
上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5
摩爾線程GPU成功適配Deepseek-V3-0324大模型
大模型競爭白熱化!智譜、MiniMax密集發(fā)布,DeepSeek V4路線圖曝光
評論