
如今,從數(shù)據(jù)中心到邊緣層,再到萬物智能網(wǎng)絡的深處,先進的Multi-Die系統(tǒng)實現(xiàn)了前所未有的性能水平。Multi-Die系統(tǒng)不是通用的單體架構(gòu)芯片,而是由一系列異構(gòu)芯片(也稱“小芯片”)組成,其中小芯片針對每個功能組件進行了優(yōu)化。雖然Multi-Die系統(tǒng)具有更高的靈活性并在系統(tǒng)功耗和性能方面表現(xiàn)優(yōu)異,但也帶來了極高的設計復雜性。
通用芯粒互連技術(shù)(UCIe)標準于2022年3月發(fā)布,旨在推動Multi-Die系統(tǒng)中Die-to-Die連接的標準化。UCIe可以簡化不同供應商和不同工藝技術(shù)芯片之間的互操作性。即便符合UCIe標準的Multi-Die系統(tǒng)在開發(fā)、測試和制造過程中表現(xiàn)良好,但在實際運行時,又如何確保系統(tǒng)的Die-to-Die連接繼續(xù)保持穩(wěn)健安全并經(jīng)過測試驗證呢?本文將探討如何通過IP、測試、硬件加速等方式滿足相關要求,從而確保Multi-Die系統(tǒng)的可靠性。

采用UCIe標準的優(yōu)勢
試想一下這種情形:Multi-Die系統(tǒng)包含兩塊芯片,分別來自兩家不同的供應商,并采用了不同的工藝技術(shù),比如7nm和3nm;而且,還需要這兩塊芯片能夠無縫地相互通信并支持行業(yè)標準協(xié)議,比如PCI Express(PCIe)和CXL等。要知道,在設計中每添加一塊芯片,系統(tǒng)的延遲就會增加,性能也會隨之降低。
要讓所有芯片協(xié)同工作,并克服延遲難題,需要遵循正確的標準。為Multi-Die系統(tǒng)采用UCIe標準具有以下幾個優(yōu)勢:
確保互操作性并降低延遲。選擇符合UCIe標準的接口IP可以實現(xiàn)芯片之間的無縫連接和互操作性,而又不會影響整個系統(tǒng)。將系統(tǒng)設計為符合UCIe標準,可以在保持相同延遲的情況下降低功耗并提高性能。
借助冗余通道實現(xiàn)故障修復。UCIe規(guī)范在PHY的兩側(cè)之間提供了冗余通道,可以通過額外的通道實現(xiàn)故障修復。無論是否連接到外部環(huán)境,所有芯片都必須通過UCIe通道進行訪問、測試和修復,同時UCIe通道還可以用于監(jiān)測正在發(fā)生的芯片問題。
為確保Multi-Die系統(tǒng)能夠長期正常工作,除了采用UCIe標準外,還需要從一開始就保證高質(zhì)量。鑒于Multi-Die系統(tǒng)的復雜性,不僅要在SoC的開發(fā)和制造過程中實現(xiàn)更高的質(zhì)量,還要在現(xiàn)場運行很長時間后繼續(xù)保持高質(zhì)量。為此,需要使用高質(zhì)量的構(gòu)建模塊(即芯片和IP)、硬件加速和驗證工具,并開展持續(xù)的測試和現(xiàn)場監(jiān)測(包括修復),從而主動解決各種潛在問題。

如何確保基于UCIe的Multi-Die系統(tǒng)穩(wěn)健運行
除了控制器和PHY IP外,以下是確保基于UCIe的Multi-Die系統(tǒng)穩(wěn)健運行的另外三項要求:
1. 使用協(xié)議驗證IP和硬件輔助驗證平臺,從一開始就保證質(zhì)量
在軟件仿真器上運行協(xié)議驗證IP解決方案,有助于從一開始就確保高質(zhì)量的UCIe組件和接口層,包括現(xiàn)場設備集成(FDI)上的協(xié)議層、原始Die-to-Die接口(RDI)上的PHY接口、中間適配層,或Die-to-Die適配器的實現(xiàn)。
隨著設計范圍擴大至全棧,涉及到多模塊芯片組配置和復雜的Multi-Die系統(tǒng)時,只靠純軟件仿真已經(jīng)難以滿足要求,需要運用更多工具來驗證整個系統(tǒng)或各個芯片。在對大型Multi-Die系統(tǒng)進行實際驗證時,硬件輔助驗證(HAV)平臺尤為關鍵,比如新思科技ZeBu硬件加速系統(tǒng)和新思科技HAPS原型系統(tǒng)。為涵蓋所有驗證用例(從早期的RTL開發(fā),到互操作性和硬件合規(guī)性驗證),多MHz周期性能、優(yōu)化的UCIe協(xié)議解決方案(事務處理器、速度適配器、硬件接口卡)和系統(tǒng)級調(diào)試抽象必不可少。
2. 通過測試確保互連性能符合預期
測試是所有芯片設計過程中的重要一環(huán)。在Multi-Die系統(tǒng)中,芯片之間的互連通常基于UCIe等接口。為確保按預期運行,這些互連中不得存在任何固定型故障、開路或短路。信號完整性非常重要,因此必須測量該參數(shù)以評估是否存在性能降級情況。UCIe標準要求具有額外的互連以實現(xiàn)冗余。鍵合后測試可以解決一些可能觸發(fā)切換互連通道的互連層面問題。在理解故障模型的基礎上開發(fā)的算法測試也可以用于評估互連缺陷。
3. 采用芯片生命周期管理策略
UCIe接口是Multi-Die系統(tǒng)中芯片之間進行功能通信的主要接口。由于UCIe接口以非常高的速度運行并且是通信的關鍵路徑,因此必須在整個生命周期內(nèi)對其進行監(jiān)測和管理。通過監(jiān)測UCIe的運行狀況,可以為汽車、醫(yī)療等領域的安全關鍵型應用提供巨大幫助。例如,在自動駕駛汽車應用中,通過對UCIe的運行狀況進行監(jiān)測,可以讓車主及時進行預防性維修,或者提醒車主到店維修,以防在高速道路上發(fā)生故障。
新思科技芯片生命周期管理(SLM)系列可在運行期間主動監(jiān)測UCIe接口,發(fā)現(xiàn)通道信號質(zhì)量下降,即在通道發(fā)生故障之前予以修復。此外,它還提供內(nèi)置自測(BIST),可檢測軟錯誤或硬錯誤以采取糾正措施。

結(jié)語
芯片設計正在發(fā)生轉(zhuǎn)變。為Multi-Die系統(tǒng)采用UCIe標準只是實現(xiàn)無縫連接和互操作性的第一步。要想駕馭先進Multi-Die系統(tǒng)設計中的復雜性,遵守UCIe標準中的要求是關鍵。如果想要進一步探索UCIe,或了解新思科技如何助力簡化Multi-Die系統(tǒng)設計流程,歡迎查閱新思科技官網(wǎng),或點擊“閱讀原文”,了解Multi-Die系統(tǒng)解決方案。






原文標題:設計更簡單,運行更穩(wěn)健,UCIe標準如何“拿捏”Multi-Die系統(tǒng)?
文章出處:【微信公眾號:新思科技】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
-
新思科技
+關注
關注
5文章
956瀏覽量
52892
原文標題:設計更簡單,運行更穩(wěn)健,UCIe標準如何“拿捏”Multi-Die系統(tǒng)?
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
軟件定義的硬件輔助驗證如何助力AI芯片開發(fā)
光伏 + 風電 + 儲能協(xié)同利器!ACCU-100讓微電網(wǎng)更穩(wěn)更省
新思科技Multi-Die方案助力車企邁向汽車電子新時代
TQKIT開發(fā)板工具讓系統(tǒng)功能調(diào)用更簡單
新思科技助力UCIe 3.0快速落地
UCIe協(xié)議代際躍遷驅(qū)動開放芯粒生態(tài)構(gòu)建
新思科技以AI驅(qū)動EDA加速Multi-Die創(chuàng)新
面向芯粒設計的最佳實踐
Cadence基于臺積電N4工藝交付16GT/s UCIe Gen1 IP
奇異摩爾Die-to-Die片內(nèi)互聯(lián)方案持續(xù)升級
不止 “接口多”,ECM-C114 核心板讓醫(yī)療設備 “聯(lián)得更通、跑得更穩(wěn)”
新思科技UCIe IP解決方案實現(xiàn)片上網(wǎng)絡互連
新思科技網(wǎng)頁端虛擬原型工具的工作流程
新思科技與三星深化合作加速AI和Multi-Die設計
手機芯片:從SoC到Multi Die
設計更簡單,運行更穩(wěn)健,UCIe標準如何“拿捏”Multi-Die系統(tǒng)?
評論