近日,2025 CCF SYS 知存科技專場論壇《多模態大模型的存算一體加速》以超預期的火爆人氣與豐碩交流成果,在北京圓滿收官。由清華大學劉勇攀、清華大學胡楊、北京大學李萌、復旦大學陳遲曉四位講者帶來的精彩報告吸引了現場百余位觀眾學習交流。從“晶圓級芯片計算架構與集成架構探究”、到“突破內存瓶頸的大模型推理軟硬件優化”、再到“2.5D/3D/3.5D存算一體集成芯片”,以及“多模態智能生成式感知芯片”,講者們帶來的不僅是干貨拉滿的研究成果,也啟發了行業技術升級的新視角。我們摘選了每位講者的部分精彩內容制作成海報,希望讓更多人聽見這場學術交流盛宴的回響。
01|晶圓級芯片計算架構與集成架構探究
報告摘要:隨著大模型任務部署的普及,對算力的需求日益增長。在當前摩爾定律放緩以及嚴峻的工藝封鎖下,需要探究新的計算節點算力提升路徑。晶圓級芯片以超大規模的單片集成方式,成為支撐下一代人工智能算力的新型芯片架構。然而,晶圓級芯片雖然帶來了高密度片上互連及海量的計算與存儲資源,但也具有獨特的設計約束。因此,協調片上互連架構設計、計算資源高密度集成與前沿大模型任務的高效執行,仍是亟待突破的關鍵問題。本報告從晶圓級芯片計算架構與集成架構兩個角度切入,嘗試提供參考性的解決方案。
02|突破內存瓶頸的大模型推理軟硬件優化
報告摘要:以ChatGPT為代表的大模型快速發展,為自然語言處理、計算機視覺等領域帶來了重要的技術革新。然而,依據scaling law,大模型的參數量呈現指數級增長的趨勢,造成了嚴峻的存儲和帶寬瓶頸。而大模型的自回歸解碼特性與長文本處理需求則進一步增加了訪存帶寬需求。在本次報告中,我將介紹課題組在大模型并行解碼、自適應調度、長文本壓縮等方面的一系列研究,通過模型/加速器協同設計和優化,降低大模型推理的計算和訪存開銷,提升大模型推理效率。
03| 2.5D/3D/3.5D存算一體集成芯片
報告摘要:隨著像AI 大模型的快速擴展,傳統計算架構面臨了巨大的挑戰。為了克服“內存墻”問題,內存驅動的架構,如計算內存(CIM)/近內存計算(PNM)架構應運而生,它們通過將計算與內存集成,減少了延遲和能耗。本報告將探討通過先進集成技術實現的2.5D/3D/3.5D異構集成在CIM/PNM系統中的可擴展性。在2.5D集成中,我們討論了一種層級流水并行映射方法,通過最小化芯片間通信來提高效率。在3D集成中,堆疊接口可提供更高的帶寬、減少互連延遲,并為AI工作負載提供可擴展的性能。我們開發了一種基于有源硅中介層的3D存算集成芯片,以實現靈活的3D通信。本報告還將討論存算芯片向3.5D拓展的優勢。這些2.5D/3D/3.5D方案為在后摩爾時代智能芯片持續推進規模化法則提供了可行的路徑,并對AI基礎設施、邊緣計算和高性能系統具有重要的意義。
04|多模態智能生成式感知芯片
報告摘要:具身智能、自動駕駛等新興應用推動了對邊緣端高效多模態處理的需求。然而,現有邊緣端多模態處理面臨兩個關鍵挑戰。一方面,多模態處理相比單模態處理帶來了更加顯著的數據搬運開銷。傳統存算分離的馮·諾伊曼架構在這種情況下會面臨顯著的計算延時和功耗開銷。為此,本團隊提出了基于存算一體的多模態智能處理架構。通過存內計算設計有效提高了邊緣端多模態處理的能效和計算速度。另一方面,我們觀察到現有工作逐漸從數據處理轉向數據生成。傳統多模態處理受限于傳感器的物理局限,常常面臨感知維度不足或物體遮擋帶來的細節缺失等挑戰。為此,本團隊提出可以將智能生成與多模態數據處理相結合,形成“虛實結合”的多模態智能處理,從而實現對傳統多模態處理的增強和突破。本報告將回顧本團隊在存內計算和多模態融合處理方面所作的加速芯片工作,進而介紹本團隊最新的生成式感知工作。最后,本報告會對多模態智能處理的未來發展趨勢做出展望。
再次感謝四位學者為參會同學們帶來的多維度的思考與啟發!知存科技期待能夠組織更多交流活動,續寫更多精彩對話。
-
AI
+關注
關注
91文章
39755瀏覽量
301347 -
知存科技
+關注
關注
0文章
71瀏覽量
5341 -
大模型
+關注
關注
2文章
3648瀏覽量
5176
原文標題:精彩回顧|重溫2025 CCF SYS 知存專場論壇的精彩瞬間
文章出處:【微信號:gh_c7acc31312b6,微信公眾號:知存科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
知存科技榮獲2025 InnoForce 50年度技術突破獎項
光庭信息亮相2025 CCF中國軟件大會
虹科動態 | 2025年11月精彩回顧
知存科技榮登2025中國半導體企業影響力百強榜單
虹科動態 | 2025年10月精彩回顧
虹科動態 | 2025年9月精彩回顧
虹科動態 | 2025年8月精彩回顧
2025 CCF SYS知存科技專場論壇精彩回顧
評論