3月31日,2026國際集成電路展覽會暨研討會(IIC2026)將在上海召開。 作為全球集成電路領域最具影響力的行業盛會之一,本屆大會以“技術賦能產業,生態鏈接價值”為核心定位,聚焦AI芯片、汽車電子、工業控制、通信系統、綠色能源等關鍵應用場景,匯聚全球IC設計、EDA工具、IP授權、先進封裝等領域的頂尖企業與專家,打造貫通芯片設計制造、能源技術革新、產品商業化落地的超級產業連接器。
屆時,國科微AI算法部部長倪亞宇將在“邊緣AI與算力芯片”垂直技術論壇上發表題為《Flash Attention-4:新一代大模型推理NPU流水線范式設計》的主題演講。
Flash Attention系列由Tri Dao團隊主導開發,其核心哲學是IO-Aware的算法-硬件協同優化:通過精細拆分計算任務以適配芯片的內存層次結構,將傳統注意力機制中的高開銷數據搬運,轉化為片上高效計算。該系列自2022年首次發布以來,已迭代至第四版,但即便是V1版本,在NPU平臺上的落地實踐仍面臨巨大挑戰。
本次演講將揭秘FlashAttention-V4如何讓算法與NPU硬件實現“默契配合”,通過流水線式的協同設計,打通訪存帶寬、存儲層級、同步機制等關鍵堵點,為國產算力平臺上的大模型推理開辟一條高效新路徑。更進一步,倪亞宇還將在演講中披露國科微新一代NPU架構——該架構支持高性能FlashAttention推理,并配套新一代工具鏈,持續夯實國科微在打造“端邊AI芯引擎”戰略中的技術積累。
-
集成電路
+關注
關注
5460文章
12631瀏覽量
375293 -
國科微
+關注
關注
0文章
121瀏覽量
7658 -
大模型
+關注
關注
2文章
3714瀏覽量
5234
原文標題:IIC2026演講預告 | 倪亞宇:新一代大模型推理NPU流水線范式設計
文章出處:【微信號:國科微,微信公眾號:國科微】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
芯啟源科技邀您共赴2026年莫斯科國際通信展覽會
展會邀請|瑞迅科技邀您共赴德國紐倫堡embedded world 2026國際嵌入式展覽會
谷東智能邀您共赴SIOF 2026上海國際眼鏡業展覽會
邁來芯邀您共赴2026上海國際汽車燈具展覽會
谷東智能邀您相約MIDO 2026意大利米蘭國際光學眼鏡展覽會
華聚邀您相約2025中國國際商用車展覽會
海瑞思邀您相約2025中國國際空調通風暨制冷及冷鏈產業展覽會
廣立微亮相2025北京微電子國際研討會暨IC WORLD大會
國科微邀您共赴IIC 2026國際集成電路展覽會暨研討會
評論