国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek開源Engram:讓大模型擁有"過目不忘"的類腦記憶

jf_28571263 ? 來源:jf_28571263 ? 作者:jf_28571263 ? 2026-01-14 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2026年1月13日凌晨,DeepSeek突然發(fā)布由創(chuàng)始人梁文鋒署名的新論文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,并同步開源記憶模塊Engram。這一機制通過可擴展查找結(jié)構(gòu),讓大模型實現(xiàn)O(1)時間復雜度的"條件反射式"記憶檢索,被業(yè)界視為破解Transformer效率瓶頸的關鍵鑰匙。

傳統(tǒng)Transformer的"記憶困境"

當前大語言模型面臨三大結(jié)構(gòu)性問題:注意力計算的O(n2)復雜度在長序列下成為瓶頸;所有知識隱式存儲在參數(shù)中,檢索常識需激活整個網(wǎng)絡;早期層負擔過重,既要做語義理解又要承擔知識檢索。這種"低效的反復計算"導致算力浪費,尤其在知識調(diào)用、代碼補全等需要高頻查表的任務中表現(xiàn)突出。

Engram的"雙通道記憶"設計

DeepSeek從神經(jīng)科學汲取靈感:人腦分為程序性記憶(騎自行車)和陳述性記憶(回憶電話號碼)。Engram將這一機制映射到模型架構(gòu)中——條件記憶負責快速查表,注意力負責靈活推理,兩者協(xié)同構(gòu)成"稀疏性的新軸"。

技術(shù)實現(xiàn)上,Engram采用哈希N-Gram嵌入機制:對輸入Token序列進行連續(xù)N個詞的切片,通過哈希算法映射到可擴展的靜態(tài)查找表。這種方法是確定性且O(1)時間復雜度的,無論存儲多少萬億記憶片段,檢索速度恒定,算力消耗極低。同時,輕量化門控機制會根據(jù)當前上下文判斷是否啟用查表結(jié)果,避免生硬注入。

實測數(shù)據(jù):性能提升超預期

DeepSeek在同等參數(shù)和算力條件下進行嚴格對比測試(均為38億激活參數(shù),2620億訓練Token):

知識密集型任務 :MMLU提升3分,CMMLU提升4.0分,TriviaQA提升1.9分

通用推理與代碼 :BBH大幅提升5.0分,HumanEval代碼生成提升3.0分,數(shù)學任務MATH提升2.4分

長上下文能力 :Multi-Query NIAH準確率從84.2躍升至97.0,Variable Tracking從77.0提升到89.0

更關鍵的是,Engram讓模型早期層不再做"苦力活",第5層的表征即可達到基線模型第12層的水平,有效深度增加一倍,省下的層數(shù)用于更復雜的推理。

行業(yè)意義:DeepSeek V4的前奏

梁文鋒連續(xù)署名兩篇論文(mHC架構(gòu)與Engram),預示DeepSeek V4的技術(shù)輪廓日漸清晰。如果說mHC是底層架構(gòu)創(chuàng)新,Engram則是在架構(gòu)層面做"分工重構(gòu)"。這種"存算分離"設計,完美契合算力受限環(huán)境下的性價比路線——在同等算力下實現(xiàn)更強性能。

對行業(yè)而言,開源Engram的價值在于:它提供了第一個可微分、可訓練、原生嵌入模型結(jié)構(gòu)的記憶增強方案,讓開發(fā)者無需從零構(gòu)建。從代碼補全到醫(yī)療知識庫,從多語言翻譯到法律條文檢索,O(1)查找式記憶將為垂直領域大模型帶來35-45%的吞吐量提升和25-35%的成本降低。

效率革命的"陽謀"

DeepSeek此舉既是技術(shù)突破,更是戰(zhàn)略卡位。當行業(yè)陷入"算力軍備競賽",它選擇用架構(gòu)創(chuàng)新打破硬約束。Engram的巧妙在于不挑戰(zhàn)Transformer根基,而是增強其薄弱環(huán)節(jié),與MoE形成"計算-記憶"雙稀疏,實現(xiàn)1+1>2。

但挑戰(zhàn)同樣存在:哈希沖突率如何控制?靜態(tài)記憶表更新機制是否成熟?在創(chuàng)意生成等需要強泛化場景下,Engram是否會產(chǎn)生"記憶固化"副作用?這些都需要大規(guī)模實戰(zhàn)檢驗。

Engram的開源,標志著大模型優(yōu)化從"參數(shù)競賽"轉(zhuǎn)向"架構(gòu)效率"。當梁文鋒將"記憶痕跡"這一神經(jīng)科學概念注入AI,我們看到的不僅是性能數(shù)字的提升,更是中國AI企業(yè)在技術(shù)路線上從追隨到并跑的自信。若DeepSeek V4搭載Engram如期上線,或?qū)⒆C明:在算力受限時代,聰明的架構(gòu)設計比野蠻的參數(shù)量堆砌更具長期價值。這場記憶革命,才剛剛開始。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301356
  • 大模型
    +關注

    關注

    2

    文章

    3648

    瀏覽量

    5179
  • DeepSeek
    +關注

    關注

    2

    文章

    835

    瀏覽量

    3255
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從"替代人力"到"智能協(xié)同":履帶式巡檢機器人的產(chǎn)業(yè)躍遷

    2026年的工業(yè)智能化轉(zhuǎn)型浪潮中,一個顯著的趨勢正在形成——工業(yè)巡檢機器人正從單純的"人力替代工具"升級為具備感知、決策與協(xié)同能力的"智能體"。
    的頭像 發(fā)表于 02-05 10:42 ?253次閱讀

    選EtherCAT模塊,別只看價格,先看"體檢報告"

    ±8kV靜電、±2kV浪涌、-42℃極寒、1500V高壓—這不是極限運動,而是DPort-ECT模塊的出廠"必修課"。本文詳解工業(yè)級EtherCAT從站如何通過嚴苛測試關
    的頭像 發(fā)表于 02-04 11:46 ?235次閱讀
    選EtherCAT模塊,別只看價格,先看&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;體檢報告&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    L3試點落地,和芯星通如何成為車企突圍的&amp;amp;quot;隱形守護者&amp;amp;quot;?

    當長安汽車與北汽極狐拿到中國首批L3級自動駕駛準入許可的那一刻,整個產(chǎn)業(yè)鏈等待多年的&quot;靴子&quot;終于落地。在這個責任主體從駕駛員轉(zhuǎn)向車企的關鍵轉(zhuǎn)折下,系統(tǒng)可靠性成為真正的&quot
    的頭像 發(fā)表于 01-04 12:03 ?523次閱讀
    L3試點落地,和芯星通如何成為車企突圍的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隱形守護者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    &amp;quot;Access violation&amp;quot; 錯誤,復位位置,重新打印

    &quot;Access violation&quot; 錯誤
    的頭像 發(fā)表于 11-08 07:16 ?529次閱讀

    南柯電子|現(xiàn)場解決EMC電磁輻射干擾:&amp;quot;雷區(qū)&amp;quot;90%的人栽在接地

    南柯電子|現(xiàn)場解決EMC電磁輻射干擾:&quot;雷區(qū)&quot;90%的人栽在接地
    的頭像 發(fā)表于 09-25 09:38 ?644次閱讀

    智慧路燈的&amp;amp;quot;智慧&amp;amp;quot;從何而來?一文讀懂單燈控制器工作原理

    燈控制器&quot;中。什么是單燈控制器?單燈控制器,顧名思義,就是為每一盞路燈配備的智能控制終端。它相當于路燈的&quot;大腦&quot;,通過接收指令、執(zhí)行操作、反饋狀態(tài),傳統(tǒng)
    的頭像 發(fā)表于 08-29 20:08 ?720次閱讀
    智慧路燈的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智慧&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;從何而來?一文讀懂單燈控制器工作原理

    光耦合器:電子世界的 &amp;quot;光橋梁&amp;quot;

    在現(xiàn)代電子設備的復雜電路中,信號的傳輸與隔離至關重要。就像城市交通中需要橋梁來跨越障礙、連接不同區(qū)域一樣,電子電路里也需要一座 &quot;橋梁&quot; 來實現(xiàn)信號的安全、高效傳輸,同時避免
    的頭像 發(fā)表于 08-22 16:58 ?1016次閱讀

    精密設備的&amp;amp;quot;電力保鏢&amp;amp;quot;:優(yōu)比施UPS如何守護數(shù)據(jù)與硬件安全?

    一、用戶痛點:精密設備的&quot;斷電恐懼癥&quot;在數(shù)據(jù)中心、醫(yī)療實驗室、工業(yè)控制等場景中,精密電子設備對電源的依賴已達到&quot;零容忍&quot;級別:數(shù)據(jù)安全危機:服務
    的頭像 發(fā)表于 07-25 09:00 ?790次閱讀
    精密設備的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力保鏢&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:優(yōu)比施UPS如何守護數(shù)據(jù)與硬件安全?

    Modbus RTU通訊協(xié)議:瑞銀電能表的&amp;quot;普通話&amp;quot;指南

    Modbus RTU協(xié)議就像工業(yè)設備間的&quot;普通話&quot;,不同品牌的電能表、傳感器等設備能夠順暢&quot;交流&quot;
    的頭像 發(fā)表于 07-18 18:30 ?1775次閱讀
    Modbus RTU通訊協(xié)議:瑞銀電能表的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;普通話&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;指南

    地熱發(fā)電環(huán)網(wǎng)柜局放監(jiān)測設備:清潔能源電網(wǎng)的&amp;amp;quot;安全衛(wèi)士&amp;amp;quot;

    文章由山東華科信息技術(shù)有限公司提供在&quot;雙碳&quot;目標驅(qū)動下,地熱發(fā)電作為穩(wěn)定基荷電源,其電網(wǎng)接入設備的可靠性至關重要。環(huán)網(wǎng)柜作為地熱電站與主網(wǎng)連接的關鍵節(jié)點,其內(nèi)部絕緣缺陷可能引發(fā)
    的頭像 發(fā)表于 07-16 10:15 ?574次閱讀
    地熱發(fā)電環(huán)網(wǎng)柜局放監(jiān)測設備:清潔能源電網(wǎng)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    為什么GNSS/INS組合被譽為導航界的&amp;amp;quot;黃金搭檔&amp;amp;quot;?

    解決方案。而ER-GNSS/MINS-05低成本組合導航系統(tǒng)的出現(xiàn),更是這一&quot;黃金組合&quot;走進了更廣泛的應用場景,高性能導航不再昂貴。
    的頭像 發(fā)表于 07-09 17:12 ?955次閱讀
    為什么GNSS/INS組合被譽為導航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黃金搭檔&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形機器人為什么要定制? ——揭秘工業(yè)場景的&amp;quot;千面需求&amp;quot;

    核心洞察:標準化機器人難以破解工業(yè)場景的&quot;需求碎片化&quot;困局。富唯智能通過?&quot;五大模塊柔性架構(gòu)+零代碼中樞&quot;?,為?人形機器人為什么要定制?提供了
    的頭像 發(fā)表于 06-10 17:19 ?1248次閱讀
    人形機器人為什么要定制? ——揭秘工業(yè)場景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    倉儲界的&amp;quot;速效救心丸&amp;quot;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關實戰(zhàn)案例

    實戰(zhàn)案例,Ethercat轉(zhuǎn)PROFINET網(wǎng)關,倉儲界的&quot;速效救心丸&quot;
    的頭像 發(fā)表于 05-11 10:32 ?765次閱讀
    倉儲界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關實戰(zhàn)案例

    電纜局部放電在線監(jiān)測:守護電網(wǎng)安全的&amp;amp;quot;黑科技&amp;amp;quot;

    文章由山東華科信息技術(shù)有限公司提供在萬家燈火的背后,有一張覆蓋全國的&quot;能源神經(jīng)網(wǎng)絡&quot;晝夜不息地運轉(zhuǎn)。電纜作為電力輸送的&quot;主動脈&quot;,其健康狀況直接
    的頭像 發(fā)表于 04-14 18:12 ?955次閱讀
    電纜局部放電在線監(jiān)測:守護電網(wǎng)安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊變壓器局放在線監(jiān)測:為地下&amp;amp;quot;電力心臟&amp;amp;quot;裝上智能聽診器

    文章由山東華科信息技術(shù)有限公司提供在城市的地下脈絡中,隧道管廊承載著電網(wǎng)的&quot;主動脈&quot;,而變壓器堪稱其中的&quot;動力心臟&quot;。這個封閉而潮濕的環(huán)境中,變
    的頭像 發(fā)表于 04-09 16:37 ?867次閱讀
    隧道管廊變壓器局放在線監(jiān)測:為地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力心臟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;裝上智能聽診器