伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型競(jìng)爭(zhēng)白熱化!智譜、MiniMax密集發(fā)布,DeepSeek V4路線圖曝光

章鷹觀察 ? 來(lái)源:章鷹觀察 ? 作者:章鷹 ? 2026-02-12 15:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2月11日晚間,智譜發(fā)布新一代旗艦?zāi)P虶LM-5,智譜稱,GLM-5在Coding與Agent能力上,取得開(kāi)源SOTA表現(xiàn),在真實(shí)編程場(chǎng)景的使用體感逼近Claude Opus 4.5,擅長(zhǎng)復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)。

智譜宣布,在全球權(quán)威的 Artificial Analysis 榜單中,GLM-5 位居全球第四、開(kāi)源第一。GLM-5擁有744B(激活 40B)參數(shù)模型,預(yù)訓(xùn)練數(shù)據(jù)從 23T 提升至 28.5T,更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平。

GLM-5構(gòu)建全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強(qiáng)化學(xué)習(xí)任務(wù),提升強(qiáng)化學(xué)習(xí)后訓(xùn)練流程效率;提出異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠持續(xù)從長(zhǎng)程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。在稀疏注意力機(jī)制方面,GLM-5首次集成 DeepSeek Sparse Attention,在維持長(zhǎng)文本效果無(wú)損的同時(shí),大幅降低模型部署成本,提升 Token Efficiency。

智譜稱,GLM-5在編程能力上實(shí)現(xiàn)了對(duì)Claude Opus 4.5的對(duì)齊,在主流基準(zhǔn)測(cè)試中取得開(kāi)源模型SOTA分?jǐn)?shù)。在SWE-bench-Verified和Terminal Bench 2.0中,GLM-5分別獲得77.8和56.2的開(kāi)源模型SOTA分?jǐn)?shù),性能超過(guò)Gemini 3 Pro。

GLM 系列模型受到全球開(kāi)發(fā)者喜愛(ài),在 GLM Coding Plan 全球爆量后,智譜公司不得不啟動(dòng)限售活動(dòng)。值得關(guān)注的是,GLM系列已經(jīng)完成已完成與華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光等國(guó)產(chǎn)算力平臺(tái)的深度推理適配。通過(guò)底層算子優(yōu)化與硬件加速,GLM-5 在國(guó)產(chǎn)芯片集群上已經(jīng)實(shí)現(xiàn)高吞吐、低延遲的穩(wěn)定運(yùn)行。

2月12日,MiniMax宣布上線最新旗艦編程模型MiniMax M2.5,目前在模型界面已經(jīng)可以選擇調(diào)用。據(jù)官方介紹,這是一個(gè)為智能體場(chǎng)景原生設(shè)計(jì)的生產(chǎn)級(jí)模型,其編程與智能體性能對(duì)標(biāo)國(guó)際頂尖模型Claude Opus 4.6,支持PC、App、跨端應(yīng)用的全棧編程開(kāi)發(fā),尤其適配 Excel高階處理、深度調(diào)研、PPT等生產(chǎn)力場(chǎng)景。M2.5模型激活參數(shù)量為10B,在顯存占用和推理能效比上有優(yōu)勢(shì),推理速度超過(guò)國(guó)際頂尖模型。

預(yù)計(jì)2月中旬,DeepSeek將會(huì)發(fā)布新一代旗艦大模型V4,根據(jù)近期由創(chuàng)辦人梁文鋒署名的論文及業(yè)內(nèi)爆料,V4 將引入 mHC 與 Engram 兩項(xiàng)核心架構(gòu)創(chuàng)新,旨在顯著降低訓(xùn)練與推理成本,并在編程能力上挑戰(zhàn)目前的行業(yè)領(lǐng)導(dǎo)者。

在DeepSeek團(tuán)隊(duì)在最新發(fā)布的論文中提出,當(dāng)前模型缺乏原生的知識(shí)查找機(jī)制,導(dǎo)致在處理靜態(tài)知識(shí)時(shí)仍需耗費(fèi)昂貴的算力重復(fù)推導(dǎo)。為此,V4 預(yù)計(jì)將引入 Engram(條件記憶模塊),其設(shè)計(jì)理念是將“記憶”與“計(jì)算”解耦。

透過(guò) Engram 技術(shù),模型能將靜態(tài)知識(shí) (如實(shí)體、固定表達(dá)) 存儲(chǔ)在廉價(jià)的 DRAM 中,而非昂貴的 GPU 高帶寬內(nèi)存 (HBM)。當(dāng)模型需要推理時(shí)再快速查找,這將釋放 GPU 算力專(zhuān)注于復(fù)雜的動(dòng)態(tài)計(jì)算。此外,另一項(xiàng)關(guān)鍵技術(shù) mHC(流形約束超連接) 則解決了超深層 Transformer 模型在訓(xùn)練時(shí),信息流動(dòng)瓶頸與不穩(wěn)定的問(wèn)題,透過(guò)嚴(yán)苛的數(shù)學(xué)「護(hù)欄」,提升模型在數(shù)學(xué)推理等任務(wù)上的表現(xiàn)。

據(jù) 美國(guó)The Information 報(bào)導(dǎo),DeepSeek V4 的內(nèi)部初步測(cè)試顯示,其編程能力已超越市場(chǎng)上的頂級(jí)模型,包括 OpenAI 的 GPT 系列與 Anthropic 的 Claude。盡管 DeepSeek 先前推出的 V3.2 版本已在多項(xiàng)基準(zhǔn)檢驗(yàn)中超越部分競(jìng)爭(zhēng)對(duì)手,但 V4 被視為核心架構(gòu)的正式繼任者,旨在進(jìn)一步鞏固其作為高性能、低成本 AI 方案的地位。

當(dāng)下,大模型的競(jìng)爭(zhēng)已經(jīng)從卷開(kāi)源社區(qū),走向爭(zhēng)奪AI時(shí)代入口的升級(jí)階段。智譜此次發(fā)布新模型之后,大幅提價(jià),說(shuō)明國(guó)產(chǎn)模型的技術(shù)能力和市場(chǎng)競(jìng)爭(zhēng)力明顯提升。在大模型從“技術(shù)競(jìng)賽”轉(zhuǎn)向“商業(yè)兌現(xiàn)”的關(guān)鍵階段,誰(shuí)能通過(guò)開(kāi)源構(gòu)建起活躍的開(kāi)發(fā)者生態(tài),并將其轉(zhuǎn)化為可持續(xù)的收入流,誰(shuí)才真正贏得下一階段。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    837

    瀏覽量

    3355
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球唯一?IBM更新量子計(jì)算路線圖:2029年交付!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近年來(lái),量子計(jì)算似乎正在取得越來(lái)越多突破,國(guó)內(nèi)外都涌現(xiàn)出不少的技術(shù)以及產(chǎn)品突破。作為量子計(jì)算領(lǐng)域的先驅(qū)之一,IBM近日公布了其量子計(jì)算路線圖,宣布將在2029年交付全球
    的頭像 發(fā)表于 06-15 00:01 ?9314次閱讀
    全球唯一?IBM更新量子計(jì)算<b class='flag-5'>路線圖</b>:2029年交付!

    昆侖萬(wàn)維天工AI大模型SkyReels V4登上Artificial Analysis榜單全球第一

    3月19日,天工AI大模型SkyReels V4登上Artificial Analysis榜單Text to Video (With Audio) 賽道全球第一,顯著超越Kling 3.0
    的頭像 發(fā)表于 03-26 10:10 ?589次閱讀

    沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型

    2月13日晚間,MiniMax正式開(kāi)源MiniMax M2.5模型。沐曦技術(shù)團(tuán)隊(duì)依托MXMACA軟件棧,在24小時(shí)內(nèi)完成曦云C500/C550 對(duì)該模型的深度適配。
    的頭像 發(fā)表于 02-26 14:19 ?944次閱讀

    模型 ai coding 比較

    tokens) 智GLM-5 / MiniMax M2.5 / DeepSeek V2(128K tokens) 4. 中文能力排名 智
    發(fā)表于 02-19 13:43

    投票總數(shù)超44萬(wàn)!星特杯投票進(jìn)入白熱化

    投票,激烈角逐多個(gè)星特杯獎(jiǎng)項(xiàng)的最終勝利。 不少企業(yè)通過(guò)公眾號(hào)、社群、客戶渠道等方式主動(dòng)發(fā)聲,邀請(qǐng)合作伙伴、上下游客戶參與星特杯投票,多個(gè)星特杯獎(jiǎng)項(xiàng)的票數(shù)曲線在近期出現(xiàn)明顯上揚(yáng),競(jìng)爭(zhēng)態(tài)勢(shì)愈發(fā)白熱化。 在企業(yè)結(jié)構(gòu)上,順
    的頭像 發(fā)表于 02-03 15:09 ?278次閱讀
    投票總數(shù)超44萬(wàn)!星特杯投票進(jìn)入<b class='flag-5'>白熱化</b>

    天數(shù)智芯重磅公布四代架構(gòu)路線圖,對(duì)標(biāo)英偉達(dá)

    電子發(fā)燒友綜合報(bào)道 1月26日,天數(shù)智芯“智啟芯程”合作伙伴大會(huì)盛大啟幕。會(huì)上,天數(shù)智芯不僅公布了四代架構(gòu)路線圖,還發(fā)布了“彤央”邊端產(chǎn)品,完成“云+邊+端”全場(chǎng)景算力布局。 ? 天數(shù)智芯AI與加速
    的頭像 發(fā)表于 01-27 16:24 ?8982次閱讀
    天數(shù)智芯重磅公布四代架構(gòu)<b class='flag-5'>路線圖</b>,對(duì)標(biāo)英偉達(dá)

    中國(guó)2040年汽車(chē)技術(shù)路線圖發(fā)布!內(nèi)燃機(jī)還能再戰(zhàn)15年?

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)在10月22日的第三十二屆中國(guó)汽車(chē)工程學(xué)會(huì)年會(huì)開(kāi)幕式上,由工業(yè)和信息化部指導(dǎo)、中國(guó)汽車(chē)工程學(xué)會(huì)組織修訂編制的技術(shù)發(fā)展指導(dǎo)文件《節(jié)能與新能源汽車(chē)路線圖3.0》正式發(fā)布
    的頭像 發(fā)表于 11-26 08:42 ?8521次閱讀
    中國(guó)2040年汽車(chē)技術(shù)<b class='flag-5'>路線圖</b><b class='flag-5'>發(fā)布</b>!內(nèi)燃機(jī)還能再戰(zhàn)15年?

    納芯微參編節(jié)能與新能源汽車(chē)技術(shù)路線圖3.0正式發(fā)布

    近期,由工業(yè)和信息化部指導(dǎo)、中國(guó)汽車(chē)工程學(xué)會(huì)組織編制的《節(jié)能與新能源汽車(chē)技術(shù)路線圖3.0》(以下簡(jiǎn)稱“路線圖3.0”)正式發(fā)布。該路線圖匯聚汽車(chē)、能源、材料、人工智能等領(lǐng)域的2000余
    的頭像 發(fā)表于 11-17 13:48 ?1742次閱讀

    曦華科技參編節(jié)能與新能源汽車(chē)技術(shù)路線圖3.0正式發(fā)布

    近日,由工業(yè)和信息化部指導(dǎo)、中國(guó)汽車(chē)工程學(xué)會(huì)組織修訂編制的《節(jié)能與新能源汽車(chē)技術(shù)路線圖3.0》(以下簡(jiǎn)稱技術(shù)路線圖3.0)正式發(fā)布。技術(shù)路線圖3.0作為引領(lǐng)行業(yè)未來(lái)15年的核心文件,凝
    的頭像 發(fā)表于 10-28 10:58 ?922次閱讀

    儲(chǔ)能戰(zhàn)略規(guī)劃:企業(yè)級(jí)儲(chǔ)能技術(shù)路線圖的制定方法與實(shí)踐指南

    在 “雙碳” 目標(biāo)與能源轉(zhuǎn)型加速推進(jìn)的背景下,儲(chǔ)能已從 “可選配置” 轉(zhuǎn)變?yōu)槠髽I(yè)優(yōu)化能源成本、保障供電安全、提升綠色競(jìng)爭(zhēng)力的 “核心基礎(chǔ)設(shè)施”。企業(yè)如何制定科學(xué)合理的儲(chǔ)能技術(shù)路線圖?本文提供一個(gè)系統(tǒng)化的框架和方法論。
    的頭像 發(fā)表于 10-25 09:36 ?1293次閱讀
    儲(chǔ)能戰(zhàn)略規(guī)劃:企業(yè)級(jí)儲(chǔ)能技術(shù)<b class='flag-5'>路線圖</b>的制定方法與實(shí)踐指南

    成都匯陽(yáng)投資關(guān)于大模型白熱化,應(yīng)用加速分化

    ? ? ? ?大模型: 加速多模態(tài)研發(fā) ,閉源模型逐步逆襲開(kāi)源 多模態(tài)技術(shù)路線尚未收斂 , 國(guó)內(nèi)外大模型廠商持續(xù)刷新 SOAT。 圖片領(lǐng)域 ,GPT-
    的頭像 發(fā)表于 09-09 09:30 ?1022次閱讀

    車(chē)規(guī)電容競(jìng)爭(zhēng)白熱化,冠坤臺(tái)系憑什么脫穎而出?

    'scon)憑借獨(dú)特的技術(shù)路線和精準(zhǔn)的市場(chǎng)定位,成功從日系巨頭村田、TDK以及陸系風(fēng)華高科等競(jìng)爭(zhēng)對(duì)手中突圍,成為行業(yè)矚目的黑馬。那么,冠坤究竟做對(duì)了什么?其成功背后的邏輯值得深入剖析。 **一、車(chē)規(guī)級(jí)認(rèn)證:從“入場(chǎng)券”到“護(hù)城
    的頭像 發(fā)表于 08-06 16:14 ?816次閱讀

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】書(shū)籍介紹+第一章讀后心得

    DeepSeek-V3中得到了優(yōu)化升級(jí)。DeepSeek-V3的發(fā)布幾乎沒(méi)有預(yù)熱和炒作,僅憑借其出色的效果和超低的成本迅速走紅。 緊接著,在2025年1月20日,DeepSeek正式
    發(fā)表于 07-17 11:59

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.62】一本書(shū)讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘

    DeepSeek-V3 的發(fā)布幾乎沒(méi)有預(yù)熱和炒作,僅憑借其出色的效果和超低的成本迅速走紅。 DeepSeek-R1 則是在 DeepSeek-V3 的基礎(chǔ)上構(gòu)建的推理
    發(fā)表于 06-09 14:38

    上新:小米首個(gè)推理大模型開(kāi)源 馬斯克:下周推出Grok 3.5

    似乎國(guó)內(nèi)外AI競(jìng)爭(zhēng)日趨白熱化,就在阿里巴巴發(fā)布Qwen3(通義千問(wèn)3)之后,引發(fā)業(yè)界廣泛關(guān)注;很多大廠在跟進(jìn),大模型不斷上新: 阿里巴巴開(kāi)源新一代通義千問(wèn)
    的頭像 發(fā)表于 04-30 16:08 ?1432次閱讀