當人工智能大模型參數規模突破萬億、算力需求呈指數級增長,傳統基于電子器件的計算硬件正面臨 “功耗墻” 與 “延遲墻” 的雙重瓶頸。在此背景下,浙江大學楊建義院士領銜的團隊歷經十余年攻關,成功研發出集成光電計算芯片,通過光子替代電子實現數據的高速并行處理,不僅將計算能效提升 3 個數量級,更突破了大規模計算硬件的架構限制,為全球算力基礎設施升級提供了 “中國方案”,開啟了計算硬件從 “電子時代” 向 “光電子融合時代” 的范式躍遷。

圖1 大規模計算硬件架構的不同演進階段
?
算力困局:電子計算的 “雙重天花板”
當前,以 GPU 為核心的電子計算架構已逼近物理極限。一方面,電子在導體中傳輸時的電阻會產生大量熱量,導致數據中心能耗激增 —— 全球數據中心年耗電量已占總發電量的 3%,其中計算硬件的能耗占比超 60%,且隨著算力需求增長,這一比例仍在攀升;另一方面,電子信號的傳輸速度受限于光速的 1/100,在大規模數據并行處理場景中,延遲問題愈發突出,例如 AI 大模型訓練過程中,數據在芯片間的傳輸延遲已占總耗時的 40% 以上。
在 AI、科學計算、量子模擬等大規模計算場景中,這一矛盾更為尖銳。以自動駕駛為例,車載系統需實時處理激光雷達、攝像頭等數十路傳感器數據,傳統電子芯片的算力與能效已難以滿足毫秒級響應需求;而在量子計算領域,電子器件的噪聲干擾更是制約量子比特規模化集成的關鍵障礙。破解這些難題,亟需跳出電子計算的傳統框架,尋找全新的計算載體與架構 —— 光子,憑借高速、低耗、抗干擾的天然優勢,成為突破困局的核心方向。
技術破壁:“光 - 電 - 算” 融合的集成創新
楊建義團隊的集成光電計算芯片,并非簡單將光子器件與電子芯片疊加,而是通過三維異質集成技術,實現了 “光信號產生 - 傳輸 - 計算 - 探測” 全鏈路的芯片級整合,攻克了光子器件微型化、光信號調控精度、光 - 電協同優化三大世界級難題。
在器件集成層面,團隊創新采用 “硅基光子 + 化合物半導體” 異質集成方案:以成熟的硅基 CMOS 工藝為基底,通過晶圓鍵合技術將銦磷(InP)激光器、鍺(Ge)探測器等關鍵光子器件與電子控制單元緊密集成,芯片面積僅為傳統分立光學系統的 1/1000,卻實現了 1024 路并行光信號處理。這一設計既保留了硅基工藝的低成本、高集成度優勢,又發揮了化合物半導體在光信號產生與探測上的高性能特性,解決了 “集成度” 與 “性能” 難以兼顧的行業痛點。
在計算架構層面,芯片突破了電子計算的 “馮?諾依曼瓶頸”。傳統電子芯片需在內存與運算單元間頻繁傳輸數據,導致大量能耗與延遲;而該光電計算芯片通過光脈沖編碼技術,將數據直接加載到光信號上,在傳輸過程中同步完成計算 —— 例如在矩陣乘法運算中,光信號可通過波長、相位的疊加實現并行計算,運算速度較同規模 GPU 提升 50 倍以上,且能耗僅為其 1/1000。團隊在實驗中驗證,該芯片處理 1024×1024 矩陣乘法時,耗時僅 0.3 微秒,能耗低至 0.01 瓦,性能指標遠超當前國際同類研究。
更關鍵的是,團隊解決了光信號調控精度的難題。通過自主研發的 “微環調制器陣列”,可實現對光信號相位、幅度的納米級精度控制,確保并行計算過程中的數據準確性。在 AI 模型推理測試中,該芯片處理 ResNet-50 圖像識別任務時,準確率達到 92.3%,與傳統電子芯片持平,卻將能效比提升至 10^4 TOPS/W(每瓦萬億次運算),為低功耗邊緣計算設備提供了新可能。
場景落地:從 “實驗室” 到 “產業端” 的跨越
當前,楊建義團隊的集成光電計算芯片已在三大領域實現場景化驗證,展現出強勁的產業化潛力:
在AI 大模型訓練領域,團隊與國內頭部 AI 企業合作,將光電計算芯片應用于大模型的卷積層運算。由于卷積運算本質是矩陣乘法,恰好匹配光電芯片的并行計算優勢 —— 在處理 10 億參數模型的卷積操作時,芯片將單步運算耗時從電子芯片的 2.1 毫秒縮短至 0.04 毫秒,且單卡算力密度達到 512 PFLOPS(每秒百萬億次浮點運算),相當于 8 片頂級 GPU 的算力,而能耗僅為其 1/5。這一突破有望大幅降低大模型訓練的時間與成本,推動千億、萬億參數模型向更廣泛場景普及。
在量子計算控制領域,該芯片的低噪聲特性成為關鍵優勢。量子比特對電磁干擾極為敏感,傳統電子控制電路的噪聲會導致量子態失準;而光信號具有天然的抗電磁干擾能力,團隊將光電計算芯片用于量子比特的操控與讀出,成功將量子態操控精度提升至 99.92%,并實現了 16 個量子比特的同步控制,為量子計算機的規模化集成提供了核心控制硬件支撐。目前,該技術已在中科院量子信息實驗室的超導量子實驗平臺中投入試用。
在邊緣計算領域,芯片的低功耗特性適配了終端設備的需求。團隊基于該芯片開發的邊緣計算模塊,體積僅為信用卡大小,功耗低至 5 瓦,卻能實時處理 4K 視頻流的目標檢測任務,響應延遲小于 10 毫秒。該模塊已在智能安防、工業質檢等場景試點應用,例如在汽車零部件質檢中,可通過高速圖像處理識別微米級缺陷,檢測效率較傳統設備提升 3 倍。
產業影響:重構計算硬件生態
楊建義團隊的研究成果,不僅是一項技術突破,更將推動計算硬件產業的 “范式重構”。從產業鏈上游看,該芯片的量產將帶動硅基光子材料、異質集成設備、高精度光調制器等細分領域的發展 —— 例如團隊研發的微環調制器已實現國產化量產,成本較進口產品降低 60%,為國內光子器件產業打開了市場空間。
在產業協同層面,該技術與上海首批中試平臺形成 “互補共振”。上海光刻膠及原材料中試平臺可為本芯片的硅基光子器件提供關鍵材料支撐,新型儲能中試平臺則能為光電計算數據中心的高效供能提供解決方案,這種跨區域、跨領域的技術協同,正加速構建 “光電子計算 - 核心材料 - 儲能支撐” 的完整產業生態。
從全球競爭視角看,該芯片使我國在光電計算領域實現 “從跟跑到領跑” 的跨越。此前,美國、歐盟已將光電計算列為重點研發方向,斯坦福大學、IBM 等機構均在推進相關研究,但楊建義團隊的芯片在集成度、能效比、場景適配性上已實現國際領先 —— 在 2024 年國際光子計算大會上,該芯片獲評 “年度突破性技術”,成為首個獲此殊榮的中國研發成果。
未來展望:走向 “全光計算” 的下一代架構
盡管已取得顯著突破,楊建義團隊仍在向更高目標邁進。團隊計劃在未來 3 年內實現 “三個升級”:一是將芯片的并行光信號路數從 1024 路提升至 4096 路,進一步提升大規模計算能力;二是開發 “光 - 電 - 存” 一體化架構,通過集成光存儲單元,徹底消除數據傳輸延遲;三是推動芯片制程從 130nm 升級至 28nm,降低量產成本,目標是將單芯片價格控制在千元以內,滿足消費電子、工業控制等大眾市場需求。
更長遠來看,該團隊的研究為 “全光計算” 奠定了基礎。隨著光子器件集成度的提升、光計算算法的優化,未來有望實現完全基于光子的計算架構,徹底擺脫電子器件的限制,為算力需求的無限增長提供可能。正如楊建義院士所言:“光電計算不是對電子計算的替代,而是融合與超越 —— 它將開啟一個‘算力無極限、能耗可感知’的新時代。”
當集成光電計算芯片逐步應用于數據中心、量子計算機、智能終端,我們看到的不僅是計算硬件的性能躍升,更是一場關乎算力基礎設施、產業生態、全球競爭格局的深刻變革。浙江大學楊建義團隊的探索,正以技術創新為筆,書寫著中國在全球高端制造領域的 “范式躍遷” 故事,為世界算力難題提供了 “中國答案”。
來源:半導體芯科技
審核編輯 黃宇
-
激光
+關注
關注
21文章
3657瀏覽量
69625 -
數據中心
+關注
關注
18文章
5648瀏覽量
75009 -
算力
+關注
關注
2文章
1528瀏覽量
16741
發布評論請先 登錄
浙江大學杭州國際科創中心PMIC師生赴芯朋微電子調研交流
東南大學光電與傳感集成團隊:集成寬頻電阻抗譜的微流控芯片實現衰老線蟲多維度器官感測
浙江大學研制出全球首個電驅動鈣鈦礦激光器
突破瓶頸!中國成功研制新型芯片 求解大規模MIMO信號檢測時效能提升超百倍
廣電計量與浙江大學先進技術研究院達成戰略合作
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經形態計算、類腦芯片
AI芯片:加速人工智能計算的專用硬件引擎
國際首創新突破!中國團隊以存算一體排序架構攻克智能硬件加速難題
宇瞳光學、浙江大學共建天工智能聯合實驗室,開啟產學研融合新篇章
光電混合新范式:全球首款128x128矩陣規模光電混合計算卡正式發布
浙江大學與大華股份共建研究生聯合培育基地
基于玻色量子相干光量子計算機的混合量子經典計算架構
浙江大學楊建義團隊:集成光電計算芯片,引領大規模計算硬件 “范式躍遷”
評論