伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepSeek開源Engram:讓大模型擁有"過目不忘"的類腦記憶

jf_28571263 ? 來源:jf_28571263 ? 作者:jf_28571263 ? 2026-01-14 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2026年1月13日凌晨,DeepSeek突然發布由創始人梁文鋒署名的新論文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,并同步開源記憶模塊Engram。這一機制通過可擴展查找結構,讓大模型實現O(1)時間復雜度的"條件反射式"記憶檢索,被業界視為破解Transformer效率瓶頸的關鍵鑰匙。

傳統Transformer的"記憶困境"

當前大語言模型面臨三大結構性問題:注意力計算的O(n2)復雜度在長序列下成為瓶頸;所有知識隱式存儲在參數中,檢索常識需激活整個網絡;早期層負擔過重,既要做語義理解又要承擔知識檢索。這種"低效的反復計算"導致算力浪費,尤其在知識調用、代碼補全等需要高頻查表的任務中表現突出。

Engram的"雙通道記憶"設計

DeepSeek從神經科學汲取靈感:人腦分為程序性記憶(騎自行車)和陳述性記憶(回憶電話號碼)。Engram將這一機制映射到模型架構中——條件記憶負責快速查表,注意力負責靈活推理,兩者協同構成"稀疏性的新軸"。

技術實現上,Engram采用哈希N-Gram嵌入機制:對輸入Token序列進行連續N個詞的切片,通過哈希算法映射到可擴展的靜態查找表。這種方法是確定性且O(1)時間復雜度的,無論存儲多少萬億記憶片段,檢索速度恒定,算力消耗極低。同時,輕量化門控機制會根據當前上下文判斷是否啟用查表結果,避免生硬注入。

實測數據:性能提升超預期

DeepSeek在同等參數和算力條件下進行嚴格對比測試(均為38億激活參數,2620億訓練Token):

知識密集型任務 :MMLU提升3分,CMMLU提升4.0分,TriviaQA提升1.9分

通用推理與代碼 :BBH大幅提升5.0分,HumanEval代碼生成提升3.0分,數學任務MATH提升2.4分

長上下文能力 :Multi-Query NIAH準確率從84.2躍升至97.0,Variable Tracking從77.0提升到89.0

更關鍵的是,Engram讓模型早期層不再做"苦力活",第5層的表征即可達到基線模型第12層的水平,有效深度增加一倍,省下的層數用于更復雜的推理。

行業意義:DeepSeek V4的前奏

梁文鋒連續署名兩篇論文(mHC架構與Engram),預示DeepSeek V4的技術輪廓日漸清晰。如果說mHC是底層架構創新,Engram則是在架構層面做"分工重構"。這種"存算分離"設計,完美契合算力受限環境下的性價比路線——在同等算力下實現更強性能。

對行業而言,開源Engram的價值在于:它提供了第一個可微分、可訓練、原生嵌入模型結構的記憶增強方案,讓開發者無需從零構建。從代碼補全到醫療知識庫,從多語言翻譯到法律條文檢索,O(1)查找式記憶將為垂直領域大模型帶來35-45%的吞吐量提升和25-35%的成本降低。

效率革命的"陽謀"

DeepSeek此舉既是技術突破,更是戰略卡位。當行業陷入"算力軍備競賽",它選擇用架構創新打破硬約束。Engram的巧妙在于不挑戰Transformer根基,而是增強其薄弱環節,與MoE形成"計算-記憶"雙稀疏,實現1+1>2。

但挑戰同樣存在:哈希沖突率如何控制?靜態記憶表更新機制是否成熟?在創意生成等需要強泛化場景下,Engram是否會產生"記憶固化"副作用?這些都需要大規模實戰檢驗。

Engram的開源,標志著大模型優化從"參數競賽"轉向"架構效率"。當梁文鋒將"記憶痕跡"這一神經科學概念注入AI,我們看到的不僅是性能數字的提升,更是中國AI企業在技術路線上從追隨到并跑的自信。若DeepSeek V4搭載Engram如期上線,或將證明:在算力受限時代,聰明的架構設計比野蠻的參數量堆砌更具長期價值。這場記憶革命,才剛剛開始。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40401

    瀏覽量

    301967
  • 大模型
    +關注

    關注

    2

    文章

    3701

    瀏覽量

    5224
  • DeepSeek
    +關注

    關注

    2

    文章

    837

    瀏覽量

    3336
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從"替代人力"到"智能協同":履帶式巡檢機器人的產業躍遷

    2026年的工業智能化轉型浪潮中,一個顯著的趨勢正在形成——工業巡檢機器人正從單純的"人力替代工具"升級為具備感知、決策與協同能力的"智能體"。
    的頭像 發表于 02-05 10:42 ?313次閱讀

    選EtherCAT模塊,別只看價格,先看"體檢報告"

    ±8kV靜電、±2kV浪涌、-42℃極寒、1500V高壓—這不是極限運動,而是DPort-ECT模塊的出廠"必修課"。本文詳解工業級EtherCAT從站如何通過嚴苛測試關
    的頭像 發表于 02-04 11:46 ?335次閱讀
    選EtherCAT模塊,別只看價格,先看&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;體檢報告&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    L3試點落地,和芯星通如何成為車企突圍的&amp;amp;quot;隱形守護者&amp;amp;quot;?

    當長安汽車與北汽極狐拿到中國首批L3級自動駕駛準入許可的那一刻,整個產業鏈等待多年的&quot;靴子&quot;終于落地。在這個責任主體從駕駛員轉向車企的關鍵轉折下,系統可靠性成為真正的&quot
    的頭像 發表于 01-04 12:03 ?608次閱讀
    L3試點落地,和芯星通如何成為車企突圍的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隱形守護者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    &amp;quot;Access violation&amp;quot; 錯誤,復位位置,重新打印

    &quot;Access violation&quot; 錯誤
    的頭像 發表于 11-08 07:16 ?612次閱讀

    南柯電子|現場解決EMC電磁輻射干擾:&amp;quot;雷區&amp;quot;90%的人栽在接地

    南柯電子|現場解決EMC電磁輻射干擾:&quot;雷區&quot;90%的人栽在接地
    的頭像 發表于 09-25 09:38 ?705次閱讀

    智慧路燈的&amp;amp;quot;智慧&amp;amp;quot;從何而來?一文讀懂單燈控制器工作原理

    燈控制器&quot;中。什么是單燈控制器?單燈控制器,顧名思義,就是為每一盞路燈配備的智能控制終端。它相當于路燈的&quot;大腦&quot;,通過接收指令、執行操作、反饋狀態,傳統
    的頭像 發表于 08-29 20:08 ?784次閱讀
    智慧路燈的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智慧&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;從何而來?一文讀懂單燈控制器工作原理

    光耦合器:電子世界的 &amp;quot;光橋梁&amp;quot;

    在現代電子設備的復雜電路中,信號的傳輸與隔離至關重要。就像城市交通中需要橋梁來跨越障礙、連接不同區域一樣,電子電路里也需要一座 &quot;橋梁&quot; 來實現信號的安全、高效傳輸,同時避免
    的頭像 發表于 08-22 16:58 ?1074次閱讀

    精密設備的&amp;amp;quot;電力保鏢&amp;amp;quot;:優比施UPS如何守護數據與硬件安全?

    一、用戶痛點:精密設備的&quot;斷電恐懼癥&quot;在數據中心、醫療實驗室、工業控制等場景中,精密電子設備對電源的依賴已達到&quot;零容忍&quot;級別:數據安全危機:服務
    的頭像 發表于 07-25 09:00 ?971次閱讀
    精密設備的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力保鏢&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:優比施UPS如何守護數據與硬件安全?

    Modbus RTU通訊協議:瑞銀電能表的&amp;quot;普通話&amp;quot;指南

    Modbus RTU協議就像工業設備間的&quot;普通話&quot;,不同品牌的電能表、傳感器等設備能夠順暢&quot;交流&quot;
    的頭像 發表于 07-18 18:30 ?1995次閱讀
    Modbus RTU通訊協議:瑞銀電能表的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;普通話&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;指南

    地熱發電環網柜局放監測設備:清潔能源電網的&amp;amp;quot;安全衛士&amp;amp;quot;

    文章由山東華科信息技術有限公司提供在&quot;雙碳&quot;目標驅動下,地熱發電作為穩定基荷電源,其電網接入設備的可靠性至關重要。環網柜作為地熱電站與主網連接的關鍵節點,其內部絕緣缺陷可能引發
    的頭像 發表于 07-16 10:15 ?619次閱讀
    地熱發電環網柜局放監測設備:清潔能源電網的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    為什么GNSS/INS組合被譽為導航界的&amp;amp;quot;黃金搭檔&amp;amp;quot;?

    解決方案。而ER-GNSS/MINS-05低成本組合導航系統的出現,更是這一&quot;黃金組合&quot;走進了更廣泛的應用場景,高性能導航不再昂貴。
    的頭像 發表于 07-09 17:12 ?1036次閱讀
    為什么GNSS/INS組合被譽為導航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黃金搭檔&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形機器人為什么要定制? ——揭秘工業場景的&amp;quot;千面需求&amp;quot;

    核心洞察:標準化機器人難以破解工業場景的&quot;需求碎片化&quot;困局。富唯智能通過?&quot;五大模塊柔性架構+零代碼中樞&quot;?,為?人形機器人為什么要定制?提供了
    的頭像 發表于 06-10 17:19 ?1371次閱讀
    人形機器人為什么要定制? ——揭秘工業場景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    倉儲界的&amp;quot;速效救心丸&amp;quot;,Ethercat轉PROFINET網關實戰案例

    實戰案例,Ethercat轉PROFINET網關,倉儲界的&quot;速效救心丸&quot;
    的頭像 發表于 05-11 10:32 ?824次閱讀
    倉儲界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat轉PROFINET網關實戰案例

    電纜局部放電在線監測:守護電網安全的&amp;amp;quot;黑科技&amp;amp;quot;

    文章由山東華科信息技術有限公司提供在萬家燈火的背后,有一張覆蓋全國的&quot;能源神經網絡&quot;晝夜不息地運轉。電纜作為電力輸送的&quot;主動脈&quot;,其健康狀況直接
    的頭像 發表于 04-14 18:12 ?1032次閱讀
    電纜局部放電在線監測:守護電網安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊變壓器局放在線監測:為地下&amp;amp;quot;電力心臟&amp;amp;quot;裝上智能聽診器

    文章由山東華科信息技術有限公司提供在城市的地下脈絡中,隧道管廊承載著電網的&quot;主動脈&quot;,而變壓器堪稱其中的&quot;動力心臟&quot;。這個封閉而潮濕的環境中,變
    的頭像 發表于 04-09 16:37 ?929次閱讀
    隧道管廊變壓器局放在線監測:為地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力心臟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;裝上智能聽診器