以下文章來源于逍遙設計自動化,作者逍遙科技
CPO技術轉型的必然性
數據中心網絡架構正在經歷向光電共封裝(CPO)交換機的根本性轉變,這種轉變主要由其顯著的功耗效率優勢所驅動。在OFC 2025展會上,這一趨勢變得極為明顯,從Jensen Huang在GTC 2025上的演示到眾多供應商展示集成在ASIC封裝內的光引擎,CPO技術已經成為塑造高帶寬網絡基礎設施未來的主導力量。
CPO技術的強有力論據在于其解決傳統可插拔光模塊所面臨的日益嚴重功耗挑戰的能力。盡管像Andy Bechtolsheim這樣的行業資深人士繼續倡導線性可插拔光模塊(LPO)作為替代方案,但擴展到更高SerDes速度的技術現實使CPO的采用幾乎不可避免。LPO雖然通過消除板載數字信號處理器相比傳統可插拔光模塊節省30%到50%的功耗,但在數據速率攀升至每通道400千兆位世代時,在ASIC與前面板光模塊之間的電氣界面上面臨著無法克服的插入損耗挑戰[1]。
1理解CPO集成方法
在ASIC封裝內集成光引擎遵循兩種主要的架構策略,每種策略都為不同的部署場景提供獨特的優勢。這些方法代表了管理電氣、熱學和光學設計約束之間復雜相互作用的完全不同的理念。
硅Interposer方法將核心die和電子集成線路(EIC)共同放置在硅Interposer上,光電子集成芯片(PIC)要么3D堆疊在EIC之上,要么位于有機基板內。這種配置創造了業內專家稱為"光學I/O"的結構,通過高密度die到die連接和復雜的Interposer布線實現核心die與光引擎之間的電氣連接縮短。然而,當高功耗EIC與核心die共享空間時,這種方法引入了顯著的熱管理復雜性,特別是當PIC堆疊在EIC頂部時,散熱變得相當困難。

圖1:將光引擎集成到半導體封裝中的不同方法,顯示了硅Interposer和有機基板方法及其各自的優勢和熱考慮因素。
替代的有機基板方法將光引擎保持在圍繞主die的有機基板上,避免了與大型硅Interposer相關的復雜性和成本。在這種配置中,PIC和EIC組件組裝在一起,通常EIC堆疊在PIC之上,形成緊湊的光引擎模塊,戰略性地安裝在核心die周圍。這種排列允許優越的熱隔離,因為光引擎可以分開放置,并可能配備單獨的散熱器或定位以優化氣流和冷板可達性。
2比較行業領導者:Broadcom和Nvidia的實現方案
當前的CPO領域由來自行業領導者Broadcom和Nvidia的兩種截然不同的方法主導,每種方法都反映了不同的優先級和目標應用。這些實現為CPO技術部署中固有的實際挑戰和權衡提供了寶貴的見解。
Broadcom的Bailly CPO交換機基于Tomohawk-5 ASIC構建,在封裝內集成了八個6.4Tbps光引擎,提供51.2Tbps的總封裝外光帶寬。這個解決方案支持64個800Gbps端口或128個400Gbps端口,代表了在800G以太網時代與當前網絡基礎設施需求相一致的實用方法。

圖2:Broadcom的實現方案,其特點是圍繞Tomohawk-5 ASIC集成的八個6.4Tbps光引擎,提供51.2Tbps總帶寬,專注于在當前數據中心環境中的實際部署。
Nvidia采用更激進的方法,其Quantum-X InfiniBand和Spectrum-X以太網平臺針對顯著更高的帶寬容量。Quantum-X系統通過四個CPO封裝提供115.2Tbps,每個提供28.8Tbps帶寬,而Spectrum-X系列從102.4Tbps擴展到令人印象深刻的409.6Tbps配置。這些雄心勃勃的規格反映了Nvidia專注于使用200G SerDes技術支持未來百萬GPU集群需求。

圖3:Nvidia雄心勃勃的Quantum-X系統架構,展示了為大規模AI集群部署提供115.2Tbps帶寬而設計的四封裝配置。
在可維護性方法上出現了一個關鍵的架構差異。Broadcom將光引擎永久綁定在封裝內,創造了一個更簡單但可維護性較低的解決方案。Nvidia通過創新的可拆卸光學子Assembly(OSA)解決了可維護性問題,其中三個1.6Tbps光子引擎聚集成可更換的4.8Tbps模塊。這種模塊化設計使得在制造測試期間可以更換有故障的光組件而無需丟棄整個交換機,盡管現場可維護性仍然具有挑戰性。

圖4:Nvidia對CPO實現的復雜方法,其特點是可拆卸光學子Assembly(OSA)和使用TSMC的COUPE工藝的先進2.5D/3D集成技術,以增強可維護性。

圖5:Quantum-X和Spectrum-X CPO封裝。提供了對Nvidia chiplet組織的詳細見解,主核心交換die與通過die到die接口緊密集成的八個I/O die,被有機基板中的光子引擎所包圍。
3技術實現細節
CPO系統背后的技術復雜性在檢查其光纖耦合和激光集成策略時變得明顯。Broadcom和Nvidia都開發了巧妙的解決方案來管理其高帶寬系統所需的大規模光連接。
Broadcom采用邊緣耦合光纖連接,通過使用自動化、高精度Assembly工藝將精確對準的光纖陣列永久綁定到波導端面來實現出色的海濱密度。其第一代CPO利用400G-FR4技術,實施粗波長分復用(CWDM)在單根光纖上承載四個100G通道,每個6.4Tbps光引擎需要16對光纖。
Nvidia的方法在激光集成中展現了顯著的效率,僅需要18個激光模塊就能為其Quantum-X系統中的所有144個光通道提供光源。每個激光模塊包含八個集成激光器并支持八個1.6Tbps光子引擎,相比Broadcom的實現方案激光模塊需求減少了四倍。這種效率伴隨著容錯性的權衡,因為單個激光故障會影響更多的光通道。
調制器技術選擇反映了功耗和可擴展性方面的不同優先級。Broadcom可能采用馬赫-曾德調制器(MZM),提供優越的溫度穩定性和激光不穩定性容忍度,但功耗更高,為每比特5-10皮焦耳。Nvidia選擇微環諧振器調制器(MRM)實現了每比特1-2皮焦耳的顯著更低功耗,具有適合高密度應用的更小占用面積,盡管需要更復雜的調諧和數字信號處理來管理熱敏感性和串擾。
4功耗效率和未來展望
CPO技術的功耗效率成就代表了其相對于傳統可插拔解決方案最引人注目的優勢。Broadcom報告每800Gbps端口約5.5瓦,相比等效可插拔模塊的15瓦,轉化為6-7皮焦耳每比特的性能,在2024年部署中領先行業。Nvidia聲稱通過其硅基光電子實現方案實現了更激進的3.5倍功耗效率改進。
這些效率提升使滿載的高帶寬交換機相比可插拔替代方案節省數百瓦特,盡管熱管理仍然具有挑戰性。兩種實現方案都需要復雜的冷卻解決方案,液體冷卻對于管理ASIC封裝內的集中功率密度變得必要。
展望未來發展,幾項新興技術有望進一步增強CPO能力。垂直耦合技術可以通過在芯片表面而不僅僅是周邊實現光輸入/輸出來克服邊緣長度約束。多芯光纖和減小光纖間距技術為顯著增加帶寬密度提供了途徑,研究演示實現了低至18微米的光纖間距。

圖6:光子Fabric或Interposer示意圖,展示了光子Interposer或Fabric的概念,如何將光交換和路由能力集成到計算chiplet下方的基礎層中,本質上為未來高帶寬應用創建光學主板。

圖7:光子Interposer示意圖,顯示了光子Interposer實現的另一種愿景,說明了光連接如何能夠為內存分解和封裝內chiplet間超低延遲通信的新架構提供支持。來源:Celestial.ai
CPO技術的未來延伸超越了傳統交換應用,進入了令人興奮的新領域。光子Fabric和Interposer代表了下一個演進步驟,可能實現光學主板,其中激光器、波導和光交換位于支持上方計算和存儲chiplet的基礎層中。雖然這些3D配置中的熱管理挑戰仍然存在,但成功的CPO交換機部署將建立技術基礎、供應鏈基礎設施和這些先進實現所需的行業信心。
向CPO技術的轉變不僅僅是簡單的組件升級,而是通過在顯著降低功耗的同時實現空前的帶寬密度從根本上重塑數據中心架構。隨著行業繼續推向更高數據速率和更苛刻的AI工作負載,CPO作為連接當前能力與未來需求的基礎技術,使其不僅是一個有吸引力的選擇,而且是下一代網絡基礎設施的必然需求。
關于我們:
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業鏈發展,致力于為客戶提供前沿技術與服務。
-
封裝技術
+關注
關注
12文章
599瀏覽量
69301 -
數據中心
+關注
關注
18文章
5647瀏覽量
75007 -
光模塊
+關注
關注
82文章
1629瀏覽量
63648
原文標題:光電共封裝技術解析
文章出處:【微信號:深圳市賽姆烯金科技有限公司,微信公眾號:深圳市賽姆烯金科技有限公司】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
CPO光電共封裝如何破解數據中心“功耗-帶寬”困局?
用于高速光電組件的光焊球陣列封裝技術
Avago推出新封裝光電耦合器
微光電子機械系統器件技術與封裝
光電共封裝
光芯片和電芯片共封裝技術的創新應用
光電共封裝技術的實現方案
評論