由于 AI 芯片的硬件與軟件之間存在高度復雜且相互依賴的關系,定制 AI 芯片已成為當今半導體行業中資金投入最高、風險最大的研發項目之一。一旦設計需要重新設計進行二次流片,成本還會大幅攀升,甚至會帶來錯失融資機會、產品上市延期以及由此導致的市場份額流失等嚴重后果。
隨著越來越多的芯片公司和初創企業投入到 AI 芯片開發中,一次流片成功已經成為技術、財務和商業層面的剛性要求。
以下是開發 AI 芯片時實現一次流片成功的十條驗證有效的策略:
1. 優先開展早期架構探索
從一開始就對 AI 芯片架構進行優化,往往能夠帶來顯著回報。借助新思科技 Platform Architect 等先進的建模與仿真工具進行早期架構探索,可以允許團隊評估算力、存儲與互連的不同配置方案及其權衡取舍。從而針對特定 AI 工作負載對性能和功耗進行優化。
由于大多數 AI 芯片采用 Multi-Die 設計,還可以使用專用工具對整體封裝內的芯粒劃分與配置進行分析和優化。通過優先開展早期架構探索,開發者團隊可以迅速識別潛在問題,并針對復雜算法和海量 AI 數據集對設計進行優化。
2. 采用經硅驗證的 IP 解決方案
使用經過硅驗證的 IP,包括高速接口、內存控制器、專用加速器和安全 IP,可以顯著降低風險并加快開發進度。新思科技提供業內最完整的 IP 產品組合,其解決方案已在所有主要晶圓廠和不同工藝節點完成硅驗證,并與 PHY、控制器及驗證 IP 預先完成驗證,同時符合主流行業標準。這些特性共同促進了生態系統的互操作性和可靠性,降低了系統集成難度,使設計團隊能夠將精力更多投入到差異化創新上。
3. 實現軟硬件協同設計
AI 芯片并非孤立運行,而是整個系統的一部分,該系統還包括軟件、固件以及外部組件。在流片前規劃階段就引入軟件團隊,有助于確保硬件設計能夠匹配 AI 芯片將支持的算法和框架。通過提供硬件模型,讓真實軟件能夠在芯片尚未到位前就運行,團隊可以在早期就進行功能驗證、實際運行性能優化,并提前發現缺陷或集成問題,避免影響產品質量或交付。
4. 在整個開發過程中持續優化能效
AI 工作負載正對全球能源資源和基礎設施造成巨大壓力。功耗效率過去常常是芯片設計中的事后考量,如今已成為貫穿始終的核心關注點,直接影響 AI 芯片的商業可行性、差異化能力和可持續性。功耗建模可以幫助團隊做出更加理性的架構決策,在不影響性能目標的前提下盡可能降低能耗。根據新思科技的客戶調研結果,相比在設計后期進行調整,在早期架構探索和 RTL 階段就關注功耗,對整體能效的影響更積極正向。
5. 進行嚴格的 RTL 設計驗證
穩健的 RTL 驗證策略應結合仿真、形式化驗證和覆蓋率驅動方法學,能夠確保功能和性能需求均得到滿足。采用 AI 驅動的行業標準流程進行早期且持續的驗證,有助于最大程度降低遺漏缺陷和后期意外的風險。
引入新思科技 ZeBu 等硬件輔助驗證(HAV)工具進行 RTL 仿真,可幫助團隊在接近真實應用條件下驗證系統行為、軟件集成情況和性能表現。硬件仿真還能捕捉僅靠傳統仿真可能會遺漏的功能缺陷、邊界場景和集成問題,從而降低昂貴的重新設計風險。
6. 利用 AI 驅動的 EDA 工具提升效率并優化 PPA
AI 驅動的 EDA 工具將回歸學習(RL)、智能助理和數據分析引入設計流程,實現日常任務的自動化處理,并挖掘設計優化空間。這些工具能夠快速評估成千上萬種設計方案,幫助團隊縮短設計周期、減少人工優化工作,并實現更具挑戰性的功耗、性能與面積(PPA)目標。
7.先進封裝設計與仿真
AI 芯片通常需要采用先進封裝方案,如 Multi-Die 架構。Multi-Die 架構允許將不同節點的芯粒組合在同一封裝內,因此能夠提升靈活性、降低成本,并滿足性能需求。然而,要實現功能優化并避免后期問題,需要在早期就對封裝系統進行協同設計、仿真與分析,包括信號完整性和熱分析。
芯片設計團隊與封裝團隊的密切協作,有助于確保從互連到散熱的各個方面都針對性能、整體成本和一次成片成功進行優化。
8. 開展全面的硅前系統級驗證
在設計送交晶圓廠之前,使用新思科技 HAPS 等平臺進行大規模硬件加速仿真、原型驗證和系統級驗證至關重要。通過實施全面的測試計劃、真實接口驗證板卡以及具備高級調試能力的快速軟件環境,可以顯著提高一次流片成功的概率,并在首批流片返回后加速上電和調試。
對于最先進的 AI 芯片設計而言,達到這種成熟度水平往往需要進行千萬億次級別的驗證與驗證循環。
9. 實現測試與全生命周期管理能力
測試策略應在首批流片回片前就完成部署,尤其是在開發 Multi-Die 設計時更是如此。面向測試的設計(DFT)能力,如掃描鏈和內建自測試(BIST),可以提升故障檢測與定位能力。這些機制能夠提供有價值的數據洞察,幫助提升良率、可靠性和性能。
還可與芯片生命周期管理(SLM)解決方案結合,在芯片整個生命周期內實現持續監控和優化。
10. 盡早選擇外部合作伙伴
與外部合作伙伴(包括晶圓廠和技術合作方)保持早期且持續的合作,對項目成功至關重要。晶圓廠能夠在工藝能力和可制造性方面提供關鍵指導。新思科技這樣的技術合作伙伴能夠提供關鍵設計工具、經硅驗證的 IP 以及基于協作的設計服務。兩者共同幫助設計團隊連接 AI 芯片所需協同工作的軟硬件生態系統。
與這些合作伙伴協作,可以彌補自有資源和經驗的不足,使團隊將更多精力聚焦于核心能力和創新,從而提升設計質量并加快產品上市速度。盡早建立重要合作關系,并在整個設計周期中持續協作,是優化 AI 芯片性能、良率和可靠性的關鍵。同時,這也有助于確保從流片到原型驗證乃至量產優化的順利過渡。
實現一次流片成功
AI 芯片開發這一具有極高風險的領域 ,容錯空間極其有限。動輒超過 1 億美元 的投資規模,以及每一個決策背后都可能帶來的高昂延期成本,使得首次流片即成功(first?pass silicon success)成為至關重要的目標。
采用嚴謹且前瞻性的開發方法,包括優先進行早期架構探索、采用經硅驗證的 IP、使用 AI 驅動的 EDA 工具、開展大規模硬件加速驗證、及早推進軟件開發、建立健全的 DFT 與 SLM 體系、以及強化跨團隊協作,能夠幫助工程團隊有效降低風險,并在既定時間和預算范圍內實現突破性的性能表現。
新思科技作為值得信賴的合作伙伴,致力于助力 AI 芯片公司實現一次流片成功,加速創新。
-
新思科技
+關注
關注
5文章
956瀏覽量
52892 -
開發者
+關注
關注
1文章
771瀏覽量
18008 -
AI芯片
+關注
關注
17文章
2126瀏覽量
36765
原文標題:AI芯片開發者必讀:“一次流片成功”十大指南
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
芯動科技與雄立科技合作高性能100G網絡通信芯片一次流片成功
新思科技與三星深化合作加速AI和Multi-Die設計
地平線征程6B一次性成功點亮
新思科技攜手微軟借助AI技術加速芯片設計
max9979把DOUT也share到一根線上,如果我一次只片選其中一個CS#, 其他未被片選的芯片DOUT會是高阻態嗎?
芯片流片首次成功率僅14%?合科泰解析三大破局技術
Cadence UCIe IP在Samsung Foundry的5nm汽車工藝上實現流片成功
新思科技分享實現AI芯片一次流片成功的十大策略
評論