電子發燒友網報道(文 / 吳子鵬)作為全球集成電路設計領域的頂級盛會,ISSCC 自 1953 年創辦以來,一直是世界最前沿固態電路技術的首發陣地,被譽為 “芯片設計國際奧林匹克會議”。ISSCC 2026 上,清華大學、華為與字節跳動聯合團隊在會上發布論文《HYDAR: A Hybrid In-Memory Computing Framework for Efficient Recommendation System Acceleration》(HYDAR:面向高效推薦系統加速的混合存內計算框架),首次提出基于 28nm 工藝的混合存內計算(Compute-in-Memory, CiM)芯片,為 AI 推薦系統(RecSys)的能效瓶頸帶來革命性突破。
這款芯片的核心突破在于,通過創新架構設計,將推薦系統核心運算的效率和能效提升 1–2 個數量級(QPS 提升 66 倍,QPS/W 提升 181 倍),為打破困擾行業多年的 “存儲墻” 提供了全新路徑。
?
然而,SVS 運算長期面臨 “高耗低效” 的行業痛點。據聯合團隊論文披露,傳統基于 CPU 或 GPU 的架構中,數據需要在處理器和內存之間頻繁搬運,SVS 占據了推薦系統絕大部分的計算時間與功耗。核心癥結在于外部存儲器訪問(EMA)的高昂開銷:采用混合鍵合技術的 DRAM 加速器成本居高不下,難以大規模普及;基于 NAND TCAM 的加速器則存在讀取延遲高、數據與距離表示精度有限等問題,無法滿足實時推薦需求。
SVS 的現有困境,為新型計算架構的誕生留下了空間。
不過,在此之前將 CiR 應用于 SVS 仍面臨多重挑戰:隨著向量庫規模擴大,能耗與延遲會急劇增加,同時會降低處理單元(PE)利用率與吞吐量,還可能導致檢索精度下降。如何解決這些矛盾,成為全球芯片設計領域的研究熱點。
針對上述痛點,清華、華為、字節跳動聯合團隊提出的 HYDAR 框架,通過 “硬件架構 + 數據流調度 + 檢索策略” 三維協同優化,成功實現了 CiR 技術在推薦系統加速器中的高效應用。基于該框架,團隊采用 28nm 工藝流片實現了一款 CiR 原型芯片,包含 36M RRAM 單元,分為 16 個并行 PE,每個 PE 包含一個 288×4096 陣列。
根據論文,HYDAR 芯片集成三大核心技術以應對實際應用挑戰:
動態延遲模數轉換器(DL-ADC):實現非 Top-K 計算的早期終止。在向量檢索過程中,芯片能提前將計算出的距離與閾值比較,直接跳過不可能成為最優結果的向量,大幅降低不必要的計算延遲與功耗。
基于預測的預取調度流水線(PPSP)數據流:針對推薦系統中常見的非規則、動態變化的工作負載,該技術能智能預測數據訪問模式、優化調度,顯著提升系統吞吐量。
由粗到精(Coarse-to-Fine)檢索架構:該設計在保證系統召回精度的前提下,實現檢索任務的高效分層處理,使得系統能夠輕松擴展至百萬甚至更大規模的向量庫,滿足商業級推薦系統需求。
?
據聯合團隊在 ISSCC 2026 上披露的實測數據,這款基于 HYDAR 框架的 28nm CiR 芯片表現亮眼:單芯片可實現 390K QPS 的吞吐率與 1574K QPS/W 的能效比,其構建的多芯片系統可支撐百萬級實時端到端推薦系統。在實際推薦系統任務中,當芯片擴展至 576M 規模的多芯片系統時,QPS 較傳統方案提升 66 倍,QPS/W 提升 181 倍,而檢索準確率與 CPU 方案相當,實現 “高效、節能、精準” 三重目標。
HYDAR 芯片的成功驗證,不僅為推薦系統這一特定場景帶來革命性的能效提升,其混合模數存內計算的設計思路更具普適意義。隨著大模型向端側部署、邊緣計算需求爆發,對高能效、低延遲 AI 計算硬件的需求日益迫切。HYDAR 芯片能夠以極低功耗,支撐電商、內容平臺等所需的百萬級實時端到端推薦系統,有望將相關數據中心的算力成本降低一個數量級。
對于產業而言,HYDAR 框架的成功,為存內計算技術在特定應用領域的深化應用指明方向。未來發展趨勢可能包括:
·技術路徑分化與融合:存內計算領域存在基于 SRAM 的極速能效路徑與基于新興存儲(RRAM)的大容量端側路徑。HYDAR 代表了后者,未來兩條路徑可能在不同應用場景中各自發展,也可能出現融合架構。
·從存內計算到存內智能:隨著技術成熟,計算可能不再是 “存內計算”,而是 “存內智能”—— 存儲器不僅是計算單元,更是智能決策單元。HYDAR 中的預測調度、自適應閾值等技術,已經展現出這種 “存內智能” 的雛形。
·生態系統構建:技術突破需要配套的軟件棧、開發工具和標準支持。未來可能出現針對存內計算架構優化的編程模型、算法庫和開發框架,降低開發者使用門檻。
·新材料新器件探索:RRAM 作為新型存儲器件,其非線性等特性曾是應用障礙,HYDAR 通過補償算法等克服了這些挑戰。未來可能出現更適合存內計算的新材料新器件,進一步提升性能。
多位行業專家分析認為,隨著存內計算技術不斷成熟,其有望成為下一代 AI 硬件的核心架構之一。
這款芯片的核心突破在于,通過創新架構設計,將推薦系統核心運算的效率和能效提升 1–2 個數量級(QPS 提升 66 倍,QPS/W 提升 181 倍),為打破困擾行業多年的 “存儲墻” 提供了全新路徑。
?痛點攻堅:推薦系統硬件困局亟待破局
在數字經濟時代,推薦系統已成為連接用戶與內容、產品的核心樞紐。無論是短視頻分發、電商推薦還是智能搜索,背后都依賴海量用戶行為數據的實時分析與精準匹配,而這一過程的核心運算單元是相似向量檢索(SVS)—— 通過計算查詢向量與大規模向量庫之間的距離,檢索出 Top-K 最鄰近向量,進而實現個性化推薦。然而,SVS 運算長期面臨 “高耗低效” 的行業痛點。據聯合團隊論文披露,傳統基于 CPU 或 GPU 的架構中,數據需要在處理器和內存之間頻繁搬運,SVS 占據了推薦系統絕大部分的計算時間與功耗。核心癥結在于外部存儲器訪問(EMA)的高昂開銷:采用混合鍵合技術的 DRAM 加速器成本居高不下,難以大規模普及;基于 NAND TCAM 的加速器則存在讀取延遲高、數據與距離表示精度有限等問題,無法滿足實時推薦需求。
SVS 的現有困境,為新型計算架構的誕生留下了空間。
HYDAR 框架:三大創新協同破局
HYDAR 芯片的創新之處,在于采用基于電阻式隨機存儲器(RRAM)的混合模數存內計算架構。與傳統計算架構 “數據存儲與計算分離” 不同,基于 RRAM 的存內計算(Compute-in-RRAM, CiR)將計算單元與存儲單元深度融合,能最大限度減少數據移動,具備存儲密度高、并行度極大的優勢,被公認為深度學習加速極具前景的技術路線。不過,在此之前將 CiR 應用于 SVS 仍面臨多重挑戰:隨著向量庫規模擴大,能耗與延遲會急劇增加,同時會降低處理單元(PE)利用率與吞吐量,還可能導致檢索精度下降。如何解決這些矛盾,成為全球芯片設計領域的研究熱點。
針對上述痛點,清華、華為、字節跳動聯合團隊提出的 HYDAR 框架,通過 “硬件架構 + 數據流調度 + 檢索策略” 三維協同優化,成功實現了 CiR 技術在推薦系統加速器中的高效應用。基于該框架,團隊采用 28nm 工藝流片實現了一款 CiR 原型芯片,包含 36M RRAM 單元,分為 16 個并行 PE,每個 PE 包含一個 288×4096 陣列。
根據論文,HYDAR 芯片集成三大核心技術以應對實際應用挑戰:
動態延遲模數轉換器(DL-ADC):實現非 Top-K 計算的早期終止。在向量檢索過程中,芯片能提前將計算出的距離與閾值比較,直接跳過不可能成為最優結果的向量,大幅降低不必要的計算延遲與功耗。
基于預測的預取調度流水線(PPSP)數據流:針對推薦系統中常見的非規則、動態變化的工作負載,該技術能智能預測數據訪問模式、優化調度,顯著提升系統吞吐量。
由粗到精(Coarse-to-Fine)檢索架構:該設計在保證系統召回精度的前提下,實現檢索任務的高效分層處理,使得系統能夠輕松擴展至百萬甚至更大規模的向量庫,滿足商業級推薦系統需求。
?據聯合團隊在 ISSCC 2026 上披露的實測數據,這款基于 HYDAR 框架的 28nm CiR 芯片表現亮眼:單芯片可實現 390K QPS 的吞吐率與 1574K QPS/W 的能效比,其構建的多芯片系統可支撐百萬級實時端到端推薦系統。在實際推薦系統任務中,當芯片擴展至 576M 規模的多芯片系統時,QPS 較傳統方案提升 66 倍,QPS/W 提升 181 倍,而檢索準確率與 CPU 方案相當,實現 “高效、節能、精準” 三重目標。
HYDAR 芯片的成功驗證,不僅為推薦系統這一特定場景帶來革命性的能效提升,其混合模數存內計算的設計思路更具普適意義。隨著大模型向端側部署、邊緣計算需求爆發,對高能效、低延遲 AI 計算硬件的需求日益迫切。HYDAR 芯片能夠以極低功耗,支撐電商、內容平臺等所需的百萬級實時端到端推薦系統,有望將相關數據中心的算力成本降低一個數量級。
未來展望:從存內計算到存內智能
此次清華、華為、字節跳動的聯合突破,不僅為推薦系統硬件加速提供全新路徑,更對我國集成電路產業與 AI 生態發展具有深遠意義。從技術層面看,該成果填補了存內計算技術在推薦系統專用加速器領域的空白,驗證了 28nm 工藝下 CiR 技術的商業化可行性 ——28nm 工藝兼具性能與成本優勢,相較于先進制程更易實現規模化量產,為后續技術落地奠定基礎。對于產業而言,HYDAR 框架的成功,為存內計算技術在特定應用領域的深化應用指明方向。未來發展趨勢可能包括:
·技術路徑分化與融合:存內計算領域存在基于 SRAM 的極速能效路徑與基于新興存儲(RRAM)的大容量端側路徑。HYDAR 代表了后者,未來兩條路徑可能在不同應用場景中各自發展,也可能出現融合架構。
·從存內計算到存內智能:隨著技術成熟,計算可能不再是 “存內計算”,而是 “存內智能”—— 存儲器不僅是計算單元,更是智能決策單元。HYDAR 中的預測調度、自適應閾值等技術,已經展現出這種 “存內智能” 的雛形。
·生態系統構建:技術突破需要配套的軟件棧、開發工具和標準支持。未來可能出現針對存內計算架構優化的編程模型、算法庫和開發框架,降低開發者使用門檻。
·新材料新器件探索:RRAM 作為新型存儲器件,其非線性等特性曾是應用障礙,HYDAR 通過補償算法等克服了這些挑戰。未來可能出現更適合存內計算的新材料新器件,進一步提升性能。
多位行業專家分析認為,隨著存內計算技術不斷成熟,其有望成為下一代 AI 硬件的核心架構之一。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
華為
+關注
關注
218文章
36003瀏覽量
262078 -
字節
+關注
關注
0文章
44瀏覽量
14377 -
存內計算
+關注
關注
0文章
35瀏覽量
1659
發布評論請先 登錄
相關推薦
熱點推薦
華為和中國移動聯合發布2025年度高階示范區AI+網絡實踐成果
3月2日,在MWC26 巴塞羅那期間的移動AI產業峰會上,華為與中國移動聯合發布了2025年度高階示范區AI+網絡的卓越實踐成果。2025年,華為與中國移動聯合創新,全球首個規模部署了
華為在MWC 2026聯合發布高品質萬兆AI園區建網技術白皮書
MWC 2026 巴塞羅那期間,在WLAN全球產業論壇2026上,華為攜手全球多家產業組織發布《高品質萬兆AI園區建網技術白皮書》(以下簡稱《白皮書》)。
沐曦股份聯合清華大學發布磁性材料AI原子基座模型
2月27日,沐曦股份聯合清華大學等多家研究機構聯合發布了磁性材料AI原子基座模型。該模型是首個覆蓋寬溫壓域的磁性材料AI原子模型,經權威專家鑒定,整體技術水平達到國際領先。
賦能AI硬件“從芯片到系統”全棧設計, 芯和半導體在DesignCon 2026上重磅發布“多智能體平臺XAI”
2026年2月25日,在全球電子設計盛會 DesignCon 2026 上,芯和半導體正式發布兩大全新產品——多智能體平臺 XAI 與 低頻電磁仿真平臺 Janus,并同步升級其“從芯片
每片低至0.016美元!清華FLEXI芯片柔性+存內計算雙突破
與顯示領域取得進展,卻長期缺乏“主動智能”能力——即本地化、低功耗、高可靠的AI計算單元。 ? 薄膜晶體管(TFT)技術的成熟帶來了更多可能性,就在1月清華大學信息國家研究中心/集成電路學院任天令教授團隊于2026年初
時識科技聯合創新成果SpikeRAM芯片入選ISSCC 2026
近日,香港科技大學(廣州)程伯俊教授團隊聯合時識科技(SynSense)、華北光電技術研究所完成的突破性研究SpikeRAM芯片,成功入選集成電路設計領域“奧林匹克”ISSCC 2026
華為亮相2025世界計算大會并聯合發布重要報告
21日上午舉行。活動現場,長沙市數據局、中國信息通信研究院云計算與大數據研究所、華為云三方聯合發布《長沙市智慧視覺體系和視頻產業體系建設情況發展報告》(以下簡稱“《報告》”),系統梳理
華為聯合發布工業與AI融合應用指南
11月20日,華為、中國信通院、清華大學人工智能研究院、羅蘭貝格管理咨詢公司聯合編寫的《工業與AI融合應用指南》(以下簡稱《指南》)全文發布,提出“新六化”工業發展趨勢和“三層五階八步
華為聯合發布重癥全救治鏈物聯網系統解決方案
華西-梅奧國際重癥醫學大會2025在四川成都召開。在AI與智慧重癥分會場,四川大學華西醫院&華西天府醫院聯合華為、四川智康科技有限責任公司重磅發布“重癥全救治鏈物聯網
智光儲能與海辰儲能聯合發布第三代級聯型高壓大容量儲能系統
近日,在第五屆全國新型儲能技術及工程應用大會現場,廣州智光儲能科技有限公司(簡稱 “智光儲能”)與海辰儲能聯合發布基于∞Cell 587Ah
科士達400kW重卡充電樁,重塑重卡補能新“樁”態
在政策與市場的多重驅動下,新能源重卡行業迎來爆發式增長。然而,充電效率低、補能設施不足、兼容性差等問題仍是制約行業發展的關鍵因素。科士達,深植電力電子技術基因,重磅推出400kW高防護直流一體式充電
WIZnet高性能以太網單片機W55MH32重磅發布!
WIZnet高性能以太網單片機W55MH32重磅發布!本文詳細解析了W55MH32芯片的高性能網絡處理能力與硬件資源,以及兩款開發板(L/Q-EVB)。芯片憑借TOE引擎、豐富外設及加
第二屆知存科技杯華東高校存內計算創新應用大賽正式啟動
在數字化浪潮席卷各行業的當下,數據量呈爆炸式增長,算力需求也水漲船高。存內計算架構作為創新解決方案,備受產學研各界關注。為推動存內
上汽集團與華為聯合發布新品牌“SAIC尚界”
4月16日,在鴻蒙智行新品發布會上,上汽集團與華為聯合發布了全新品牌“SAIC尚界”。上汽集團總裁賈健旭與華為常務董事、終端BG董事長余承東攜手登臺,揭曉這一最新戰略合作成果,標志著雙
ISSCC 2026重磅:清華+華為+字節聯合發布存內計算芯片,重塑推薦系統能效邊界
評論