
本文轉(zhuǎn)載自《半導(dǎo)體行業(yè)觀察》感謝《半導(dǎo)體行業(yè)觀察》對新思科技的關(guān)注 PCI Express (PCIe) 6.0規(guī)范實現(xiàn)了64GT/s鏈路速度,還帶來了包括帶寬翻倍在內(nèi)的多項重大改變,這也為SoC設(shè)計帶來了諸多新變化和挑戰(zhàn)。對于HPC、AI和存儲SoC開發(fā)者來說,如何理解并應(yīng)對這些變化帶來的設(shè)計挑戰(zhàn)變得至關(guān)重要。 本文將就上述問題和方案作詳細介紹及探討。 PCIe 6.0的重大新變化 變化一:PCIe 6.0電器性發(fā)生根本性的機制改變 為了實現(xiàn)64GT/s的鏈路速度,PCIe 6.0采用脈沖幅度調(diào)制4級 (PAM4) 信號,在與32GT/s PCIe相同的單元間隔(UI)中提供4個幅度級別(2 位)。圖1顯示了三眼眼圖與此前的單眼眼圖的對比。
圖 1:與NRZ信號相比,PCIe 6.0 PAM-4信號是三眼眼圖
與NRZ相比,轉(zhuǎn)換到PAM4信號編碼引入了更高的誤碼率(BER)。為緩解這種情況,6.0規(guī)范在以 64GT/s 運行時實現(xiàn)了許多新功能。例如,當(dāng)將新的4級電壓眼圖映射到數(shù)字值時,格雷編碼可以最小化每個 UI 內(nèi)的錯誤,并且發(fā)送器應(yīng)用預(yù)編碼來最小化迸發(fā)錯誤;PCIe 6.0還采用前向糾錯(FEC)機制來降低較高的誤碼率。這些對 PCIe 協(xié)議和控制器設(shè)計都具有重大影響。
變化二:新一代協(xié)議的引入
PCIe 6.0 引入了全新的“FLIT 模式”,其中數(shù)據(jù)包被組織在固定大小的流控制單元中,而不是過去規(guī)范版本中的可變大小。這種模式簡化了控制器級別的數(shù)據(jù)管理,帶來了更高的帶寬效率、更低的延遲和更小的控制器占用空間。當(dāng)以 64GT/s 的速率運算時,F(xiàn)LIT 模式使用未編碼數(shù)據(jù)(稱為“1b1b 編碼”),而 128/130 編碼用于 8GT/s 至 32GT/s 的鏈路速度,經(jīng)典8b10b編碼用于2.5GT/s 和 5GT/s 的鏈路速度。
與具有相同配置的 32GT/s PCIe 控制器相比,64GT/s PCIe 6.0 控制器所需的硅面積顯著增加;支持1b1b編碼不僅增加了第三物理層路徑(位于 8b10b 和 128b130b 頂部),還增加了數(shù)據(jù)鏈路層中的邏輯;FLIT模式中使用的新優(yōu)化標(biāo)頭,也進一步增加了邏輯門數(shù),超過了 32GT/s 解決方案。
變化三:PIPE數(shù)據(jù)路徑寬度增加,每個時鐘周期有多個數(shù)據(jù)包
為了保持與上一代相同的最大時鐘頻率,64GT/s下PIPE數(shù)據(jù)路徑寬度增加了一倍,即需要1024位數(shù)據(jù)路徑的16通道設(shè)計,這為芯片設(shè)計帶來了新的問題。
要知道,大于128位的數(shù)據(jù)路徑寬度,可能會導(dǎo)致SoC需要在每個時鐘周期處理多個PCIe 數(shù)據(jù)包。最小的PCIe事務(wù)層數(shù)據(jù)包 (TLP) 可以被視為 3 個 DWORD(12 字節(jié))加上 4 字節(jié) LCRC,總共 16 個字節(jié)(128 位)。在 8GT/s 時,使用PCIe PHY的 500MHz 16 位 PIPE 接口最為常見,這意味著8通道及以下(16 位/通道 * 8 通道 = 128 位)的鏈路寬度會在每個時鐘最多傳輸一個完整的數(shù)據(jù)包。但是,16通道(16位/通道 * 16通道 = 256位)在每個時鐘周期就需要傳輸兩個完整的數(shù)據(jù)包。
如表1顯示,隨著鏈路速度的提高,每個時鐘的完整數(shù)據(jù)包的數(shù)量相應(yīng)增加,從而影響越來越多的設(shè)計。
表 1:數(shù)據(jù)路徑寬度隨鏈路速度增加,導(dǎo)致更多配置超過128位閾值
PCIe 6.0的優(yōu)化設(shè)計
1.松弛排序
PCIe排序規(guī)則需要Posted事務(wù),例如內(nèi)存寫入保持有序,除非數(shù)據(jù)包標(biāo)頭中設(shè)置了松弛排序 (RO) 或 ID 排序 (IDO) 屬性。使用RO集的Posted事務(wù)可以傳遞任何先前 Posted 事務(wù),而使用IDO集的事務(wù)只能使用不同的請求者ID傳遞先前事務(wù)。
以下四個示例展示了這兩種屬性對于實現(xiàn)完整的PCIe 64GT/s 性能的重要性。他們均利用4個PCIe內(nèi)存的序列寫入256字節(jié)中的每一個,表示將1KB 有效載荷遞送到地址1000,然后是4個字節(jié)的PCIe內(nèi)存寫入,表示將“成功完成”指示遞送到地址7500。表中的每一行代表一個時間段,而三列(從左到右)表示事務(wù)到達PCIe引腳、應(yīng)用程序接口和 SoC 內(nèi)存。在所有 4 次內(nèi)存寫入之前,“成功完成”指示到達內(nèi)存的任何場景都反映出失敗,因為軟件在收到指示后立即可進行數(shù)據(jù)處理,因此在交付正確的數(shù)據(jù)之前處理。
示例1:只要其中一個應(yīng)用程序接口的帶寬至少等于 PCIe 帶寬,該接口就可以正常工作。
表 2:單一全速率應(yīng)用程序接口可正確傳輸數(shù)據(jù)
示例2:雙接口通常會出現(xiàn)故障,因為無法保證SoC中兩個通往內(nèi)存的獨立路徑之間的到達順序。
表 3:顯示雙半速率應(yīng)用程序接口失敗,原因是“成功完成”指示早于所有數(shù)據(jù)到達
示例3:將強排序流量強制到單個接口可避免出現(xiàn)無序到達,但由于無法使用全部內(nèi)部帶寬,因此很快落后于 PCIe 鏈路。
表 4:由于無法全速傳輸數(shù)據(jù),所示的雙半速應(yīng)用程序接口失敗
示例4:當(dāng)鏈路伙伴把數(shù)據(jù)有效載荷數(shù)據(jù)包標(biāo)記為 RO 且把成功完成數(shù)據(jù)包標(biāo)記為強排序時,兩個半速率接口可以成功傳輸。請注意,當(dāng) RO 有效載荷數(shù)據(jù)無序到達時,非 RO 寫入 7500 不被允許傳遞有效載荷寫入,因此在發(fā)送所有先前寫入之前,不會將其發(fā)送到應(yīng)用接口。
表 5:顯示雙半速應(yīng)用程序接口通過對有效載荷數(shù)據(jù)使用松弛排序成功
SoC 設(shè)計人員可以在其出站數(shù)據(jù)流中設(shè)置RO屬性,并顯著提高PCIe鏈路性能。IDO排序?qū)傩栽谠S多情況下都具有類似的優(yōu)勢,大多數(shù) PCIe 實現(xiàn)都可以將其應(yīng)用于其傳輸?shù)拿總€數(shù)據(jù)包。
具有IDO集的數(shù)據(jù)包僅被允許傳輸具有不同請求者 ID 的先前事務(wù),這意味著數(shù)據(jù)包來自 PCIe 鏈路上的不同邏輯代理。大多數(shù)端點實現(xiàn)(單功能和多功能)都對與往返于其他 PCIe 端點的流量相關(guān)的數(shù)據(jù)排序漠不關(guān)心,因為它們通常只與RC通信。同樣,大多數(shù)RC通常不會在多個端點之間混合相同的流量流,因此在這兩種情況下,都沒有與其他設(shè)備的請求者 ID 相關(guān)的排序問題。與此類似,大多數(shù)多功能端點對功能之間的數(shù)據(jù)排序也不關(guān)心,因此也不必擔(dān)心自己的請求者ID之間的排序。因此,大多數(shù)實施已經(jīng)可以為他們發(fā)起的所有事務(wù)設(shè)置IDO。
2.增加應(yīng)用程序接口
除了上文討論的因素外,當(dāng)數(shù)據(jù)包小于接口寬度時,利用多個較窄的應(yīng)用程序接口可顯著提高整體性能。圖 2 顯示了新思科技 PCI Express 6.0 控制器IP上64GT/s Flit模式下在發(fā)送連續(xù)的 Posted TLP流方面的傳輸鏈路利用率。對于更大的數(shù)據(jù)路徑寬度,顯然需要更大的數(shù)據(jù)包來通過單個應(yīng)用程序接口保持完全的鏈路利用率,1024 位接口需要 128 字節(jié)的有效負載。
圖 2:在 64GT/s FLIT 模式下,利用單個應(yīng)用程序接口進行傳輸?shù)母鞣N有效荷載大小和數(shù)據(jù)路徑寬度的鏈路利用率
3.解決小數(shù)據(jù)包效率低下
相反,當(dāng)新思科技控制器配置為兩個應(yīng)用接口并運行相同的流量模式時,就會有明顯的改進,現(xiàn)在64字節(jié)的有效負載即使在 1024 位數(shù)據(jù)路徑中也能產(chǎn)生完全的鏈路利用率,如圖 3 所示。
圖 3:在 64GT/s FLIT 模式下,通過兩個應(yīng)用接口配置進行傳輸?shù)母鞣N有效載荷大小和數(shù)據(jù)路徑寬度的鏈路利用率
雖然大多數(shù)設(shè)備幾乎無法控制其流量模式,但小數(shù)據(jù)包可以實現(xiàn)更少帶寬。新思科技 CoreConsultant 使用最大有效負載大小和往返時間 (RTT) 等參數(shù)來配置 PCIe 6.0 控制器中的緩沖區(qū)大小、突出 PCIe 標(biāo)簽數(shù)量和其他關(guān)鍵參數(shù)。
圖4和圖5顯示了從新思科技的 64GT/s x4 控制器的仿真中獲得的數(shù)據(jù)。該控制器配置為 512 字節(jié)最大有效載荷大小和 1000nS RTT 掃描,覆蓋一系列有效載荷大小和 RTT 值。如果在同一范圍內(nèi)重復(fù)相同的掃描,但任意一個參數(shù)降低,則當(dāng)掃描通過優(yōu)化范圍后,性能會降低。
圖 4:小尺寸 Posted 數(shù)據(jù)包效率低下
圖 5:小尺寸Non-Posted數(shù)據(jù)包效率低下,在一系列往返時間范圍內(nèi)掃描
總結(jié)
實施 64GT/s PCIe 接口的 SoC 設(shè)計人員應(yīng)確保其支持松弛排序?qū)傩裕从行лd荷而非相關(guān)控制上的RO,以及所有數(shù)據(jù)包上的IDO,除非應(yīng)用程序有異常要求。這是在整個 64GT/s 生態(tài)系統(tǒng)中實現(xiàn)高性能的關(guān)鍵部分。
為x4和更寬鏈路實施64GT/s PCIe的設(shè)計人員需要注意每個時鐘周期的多個數(shù)據(jù)包,并應(yīng)根據(jù)其典型流量大小考慮多個應(yīng)用接口。
所有64GT/s實施者都應(yīng)為1GHz(或更快)的設(shè)計實現(xiàn)做好準(zhǔn)備,并且應(yīng)確保通過硅前性能模擬檢查其假設(shè)。
對于上述這些優(yōu)化設(shè)計辦法,新思科技提供完整的PCIe 6.0解決方案(包括控制器、PHY 和 VIP)。這些解決方案支持松弛排序?qū)傩浴AM-4 信號、FLIT 模式、L0p 電源、高達 1024 位的架構(gòu)以及多個應(yīng)用程序接口選項,有助于更輕松地過渡到64GT/s PCIe設(shè)計。
立即掃碼了解更多PCIe 6.0 信息


? ?
原文標(biāo)題:如何破解PCIe 6.0帶來的芯片設(shè)計新挑戰(zhàn)?
文章出處:【微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
新思科技
+關(guān)注
關(guān)注
5文章
956瀏覽量
52892
原文標(biāo)題:如何破解PCIe 6.0帶來的芯片設(shè)計新挑戰(zhàn)?
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
PCIe 7.0發(fā)布:16通道雙向512GB/s,擁抱光纖未來
電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)日前,PCI-SIG 宣布正式推出 PCIe 7.0 規(guī)范。PCIe 7.0 繼續(xù)沿用自 PCIe 6.0 引入的 PAM4(四電平脈沖幅度調(diào)制)信號
總線授時卡優(yōu)勢解讀 #雙模pcie授時卡 #北斗pcie授時卡 #pcie授時板卡 #總線 #同步天下
PCIe
jf_16650182
發(fā)布于 :2026年02月03日 10:18:45
如何突破AI存儲墻?深度解析ONFI 6.0高速接口與Chiplet解耦架構(gòu)
:ONFI 6.0 PHY IP作為全球領(lǐng)先的集成電路IP供應(yīng)商,奎芯科技已實現(xiàn)對ONFI 6.0標(biāo)準(zhǔn)的全面支持,旨在破解大數(shù)據(jù)時代的存取鴻溝。? 極致傳輸速率:支持最高 4800Mbps(符合
發(fā)表于 01-29 17:32
CPX:借助CPC/CPO實現(xiàn)AI擴展與擴容| Samtec受邀參與Keysight PCIe研討會并分享
12月18日于上海張江舉行的 2025 Keysight PCIe 6.0UAlink專題測試技術(shù)研討會。 交流和學(xué)習(xí)是我們行業(yè)發(fā)展進步的源動力。 作為PCIe以及信號完整性方面的專家,虎家團隊愿意
PCIe協(xié)議分析儀的核心功能與工作原理
當(dāng) AI 數(shù)據(jù)中心的算力需求呈指數(shù)級爆發(fā),PCIe 6.0 已然成為那條不可或缺的“高速公路”。但你是否想過,當(dāng)雙向帶寬狂飆至 512 GB/s(PCIe 7.0 規(guī)范),信號傳輸?shù)拿恳粋€微小抖動
今日看點:我國科學(xué)家研制出高精度可擴展模擬矩陣計算芯片;Microchip 推出首款 3nm PCIe Gen 6 交換芯片
量子安全加密。 ? 得益于 PCIe 6.0 帶來的雙倍每通道帶寬以及 FLIT 流量控制單元模式、輕量級 FEC 前向糾錯系統(tǒng)和動態(tài)資源分配等新特性,該芯片能更有效率地實現(xiàn)各類 XP
發(fā)表于 10-14 11:34
?1328次閱讀
PCIe 6.0 SSD主控芯片狂飆!PCIe 7.0規(guī)范到來!
? 電子發(fā)燒友網(wǎng)綜合報道,早在2022年1月,PCI-SIG 組織正式發(fā)布了 PCIe 6.0 標(biāo)準(zhǔn),與 PCIe 5.0 相比帶寬再次翻倍,達到64 GT / s。 ? PCIe
曙光存儲超級隧道技術(shù)助力應(yīng)對PCIe 6.0時代
8月29日,聚焦“智存·智算·智能”的第二屆CCF中國存儲大會在武漢隆重召開。會上,曙光存儲副總裁郭照斌宣布,“超級隧道”技術(shù)能更好的應(yīng)對PCIe 6.0時代,為下一代國產(chǎn)芯片效能釋放提供加速引擎。
PCIe 6.0 SSD主控芯片曝光!4nm制程,順序讀取高達28 GB/s
電子發(fā)燒友網(wǎng)綜合報道,日前,慧榮科技首次曝光了其下一代企業(yè)級SSD主控芯片——SM8466。該款重磅新品將支持PCIe Gen6標(biāo)準(zhǔn),采用臺積電4nm制程,可實現(xiàn)高達28 GB/s的順序讀取和7M
PCIe插槽秒變M.2存儲倉!免拆機維護神器M.2 NVMe轉(zhuǎn)PCIe 4.0 x4 硬盤抽取盒!#pcie
PCIe
ICY DOCK硬盤盒
發(fā)布于 :2025年05月29日 17:34:11
攜手Synopsys與Keysight C位出道 | Samtec PCIe 6.0 Demo
新思科技的高級應(yīng)用工程師雷天語(圖中),與Samtec資深FAE胡亞捷(圖右),一同參與了本次PCIe 6.0 連接性能的Demo演示。 他
發(fā)表于 05-08 14:07
?4129次閱讀
Diodes公司PCIe 6.0時鐘緩沖器介紹
PI6CB3320xxA 系列為 PCIe 6.0 時鐘緩沖器,具有 20、16、13、12、8 和 4 通道低功耗 HCSL 輸出,具有 85Ω或 100Ω輸出阻抗的片上終端 (On-Chip Termination)。
PCIe 7.0最終版草案發(fā)布,傳輸速率128 GT/s,PCIe 6.0加速商業(yè)化
PCIe 7.0最終版草案發(fā)布,傳輸速率128 GT/s,PCIe 6.0加速商業(yè)化 ? 電子發(fā)燒友網(wǎng)綜合報道,近日,PCI-SIG 組織公布了 PCI Express 7.0 規(guī)范的0.9 版草案
發(fā)表于 03-29 00:07
?1170次閱讀
核芯互聯(lián)推出面向PCIe 5.0/6.0的32/64Gbps高速重驅(qū)動器芯片CLH3264R
在數(shù)據(jù)中心、人工智能和高性能計算需求爆發(fā)的今天,高速信號傳輸?shù)姆€(wěn)定性和效率成為系統(tǒng)設(shè)計的核心挑戰(zhàn)。核芯互聯(lián)推出的CLRD320八通道redriver(線性轉(zhuǎn)接驅(qū)動器)芯片,憑借多項技術(shù)創(chuàng)新,為
是德科技PCIe 6.0發(fā)射機合規(guī)性測試解決方案
隨著 PCIe 6.0 標(biāo)準(zhǔn)剛剛進入市場,PCI-SIG 組織已著手推動下一代標(biāo)準(zhǔn)——PCIe 7.0,預(yù)計將在 2025 年正式發(fā)布,持該標(biāo)準(zhǔn)的設(shè)備預(yù)計將在 2026 年問世,而大規(guī)模商用
如何破解PCIe 6.0帶來的芯片設(shè)計新挑戰(zhàn)?
評論