電子發燒友網報道(文/周凱揚)數據中心作為CPU、GPU和加速器廠商最為關注的市場,自然也少不了RISC-V這個新架構來摻和一腳。我們在之前的文章中也對RISC-V在數據中心的進展做了一些介紹,RISC-V雖然在服務器通用CPU上發力跡象不明顯,但要說AI加速器這類產品,很有可能會是RISC-V打入數據中心市場的最佳方向。
谷歌的RISC-V戰略
自己設計芯片的服務器廠商之一,谷歌,似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上,SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器,用于在數據中心上運行TensorFlow、Pytorch和JAX等機器學習框架。
而TPU的主要計算單元就是矩陣乘法打算(MXU),由脈動陣列中的128x128乘法/累積器組成,在最小配置v4版TPU中包含4個TPU芯片,每個TPU芯片都有8個MXU,是TPU v3版的兩倍,而且每個MXU都能使用BF16執行每周期16K的乘積累加運算。
然而,谷歌發現雖然TPU的機器學習算力雖然夠用,但客戶在利用這類大型AI加速器時,往往無法用它來完成其他的復雜計算負載,所以谷歌的做法是將SiFive的X280處理器核心,作為TPU的協處理器,用來提供維護和運行代碼,跑加速器沒法運行的內核。
雖然SiFive的X280主打的是加速AI/ML計算,但主要是針對邊緣端,比如AR/VR、數碼相機等等,并非用于數據中心的大型AI加速器。但在與谷歌等廠商的合作下,SiFive推出了一個名為矢量定制協處理器接口(VCIX)的技術,可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。
這相比其他方案來說,矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲,還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作,前者負責運行完整的Linux系統和虛擬機管理程序,后者負責密集的機器學習運算。
英特爾HorseCreek初見端倪
早在去年,英特爾就宣布將會用到SiFive的P550高性能RISC-V核心,以及自己的7nm工藝(即現在的Intel4工藝)來打造一款RISC-V SoC,代號名為HorseCreek。雖然到了2022年,SiFive最高性能的核心已經成了P650。但作為一個十三級流水線、三發射、亂序的64位RISC-V核心,P550的性能仍然是相當能打的,SiFive給到的定位也是對標ARM的Cortex-A75,同時只需不到一半的面積。
不過消息公布后,英特爾雖然又開展了一系列與RISC-V相關的行動,比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發平臺等等,但HorseCreek卻始終不見蹤影。
而在今年的IntelInnovation大會上,英特爾的不少合作伙伴都在現場搭建了展臺,也有參會者終于在現場看到了HorseCreek的真面目。在Intel4工藝的加持下,HorseCreek將4個2.2GHz的SiFiveP550核心、DDR5和PCIe5集成到了4mmx4mm的單個裸片上,連英特爾CEO PatGelsinger本人也親自來展臺查看HorseCreek的開發平臺。
根據展臺上公開的數據,HorseCreek配備了三級緩存,包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內存控制器,支持到5600頻率的DDR5內存,PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內存編譯器、標準單元等數模IP以外,HorseCreek還用到了其他的IP,比如西門子的DFT和新思的NOC Fabric。
從以上數據可以看出,HorseCreek是一個集SiFive、英特爾和EDA廠商IP大成的SoC。如此強大的SoC加上豐富的接口支持,完全可以用于數據中心里。不過,HorseCreek的首個終端產品形態應該是SiFive的下一代HiFive開發板。上一代的HiFive Unmatched開發板已經售罄了,在疫情相關的供應鏈問題下,SiFive已經放棄了補貨的打算,轉而全力去打造下一代基于HorseCreek的HiFive開發板。
又一個千核RISC-V芯片
在戴爾的HPC社區大會上,來自美國的初創半導體公司InspireSemiconductor公布了他們為數據中心提供的RISC-V加速器方案,同時還給出了另一個有趣的說法,那就是現有的高性能計算方案已經“不夠好”了。
在他們看來,目前的主流數據中心CPU都太慢了,無論有無加速器的輔助都是如此,而在有了加速器以后,90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案,InspireSemiconductor指出這兩者的編程太復雜了,不僅鎖定了軟件棧,而且需要特定的技能才能獲得足夠好的計算結果。而ASIC和AI加速器的風險又太高了,從成本、時間上看都是如此。
為此,InspireSemiconductor推出了他們的RISC-V加速器方案,Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心,單個PCIe加速卡上的核心數量更是超過5000個。InspireSemiconductor稱他們用到了創新的高速互聯方案,在高效利用這么多核心的同時,最高可以組成256個芯片的陣列。
相較其他加速器和GPU方案,Thunderbird加速器也有著功耗上的優勢,單芯片的功耗在175W左右,同時他們給出了20W/Tflops的能效比,看來Thunderbird的峰值算力大概就在8.75Tflops左右了。雖然會上InspireSemiconductor也展示了谷歌、聯想和IBM等客戶或合作伙伴的一些反饋,但這些不少是客套話,是否已經用于這些公司的數據中心方案中還不好說。
InspireSemiconductor同時承諾了一個對開發者友好的軟件生態系統,但他們并沒有給出自己的軟件方案,而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態系統,比如OneAPI等,所以不必像競品芯片那樣去開發一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發者,無需像GPU那樣去學習CUDA、OpenCL,而是可以用Pragma和MPI這樣的標準編譯器方案。
AI編程上也是如此,InspireSemiconductor指出流行的AI框架,諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持,Linux也在操作系統支持的行列中。如此看來,InspireSemiconductor目前應該只提供了純硬件方案,而這樣的產品是否能在市面上取得成功,目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態了。
谷歌的RISC-V戰略
自己設計芯片的服務器廠商之一,谷歌,似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上,SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器,用于在數據中心上運行TensorFlow、Pytorch和JAX等機器學習框架。
而TPU的主要計算單元就是矩陣乘法打算(MXU),由脈動陣列中的128x128乘法/累積器組成,在最小配置v4版TPU中包含4個TPU芯片,每個TPU芯片都有8個MXU,是TPU v3版的兩倍,而且每個MXU都能使用BF16執行每周期16K的乘積累加運算。
然而,谷歌發現雖然TPU的機器學習算力雖然夠用,但客戶在利用這類大型AI加速器時,往往無法用它來完成其他的復雜計算負載,所以谷歌的做法是將SiFive的X280處理器核心,作為TPU的協處理器,用來提供維護和運行代碼,跑加速器沒法運行的內核。

雖然SiFive的X280主打的是加速AI/ML計算,但主要是針對邊緣端,比如AR/VR、數碼相機等等,并非用于數據中心的大型AI加速器。但在與谷歌等廠商的合作下,SiFive推出了一個名為矢量定制協處理器接口(VCIX)的技術,可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。
這相比其他方案來說,矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲,還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作,前者負責運行完整的Linux系統和虛擬機管理程序,后者負責密集的機器學習運算。
英特爾HorseCreek初見端倪
早在去年,英特爾就宣布將會用到SiFive的P550高性能RISC-V核心,以及自己的7nm工藝(即現在的Intel4工藝)來打造一款RISC-V SoC,代號名為HorseCreek。雖然到了2022年,SiFive最高性能的核心已經成了P650。但作為一個十三級流水線、三發射、亂序的64位RISC-V核心,P550的性能仍然是相當能打的,SiFive給到的定位也是對標ARM的Cortex-A75,同時只需不到一半的面積。
不過消息公布后,英特爾雖然又開展了一系列與RISC-V相關的行動,比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發平臺等等,但HorseCreek卻始終不見蹤影。

根據展臺上公開的數據,HorseCreek配備了三級緩存,包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內存控制器,支持到5600頻率的DDR5內存,PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內存編譯器、標準單元等數模IP以外,HorseCreek還用到了其他的IP,比如西門子的DFT和新思的NOC Fabric。

又一個千核RISC-V芯片
在戴爾的HPC社區大會上,來自美國的初創半導體公司InspireSemiconductor公布了他們為數據中心提供的RISC-V加速器方案,同時還給出了另一個有趣的說法,那就是現有的高性能計算方案已經“不夠好”了。
在他們看來,目前的主流數據中心CPU都太慢了,無論有無加速器的輔助都是如此,而在有了加速器以后,90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案,InspireSemiconductor指出這兩者的編程太復雜了,不僅鎖定了軟件棧,而且需要特定的技能才能獲得足夠好的計算結果。而ASIC和AI加速器的風險又太高了,從成本、時間上看都是如此。
為此,InspireSemiconductor推出了他們的RISC-V加速器方案,Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心,單個PCIe加速卡上的核心數量更是超過5000個。InspireSemiconductor稱他們用到了創新的高速互聯方案,在高效利用這么多核心的同時,最高可以組成256個芯片的陣列。

InspireSemiconductor同時承諾了一個對開發者友好的軟件生態系統,但他們并沒有給出自己的軟件方案,而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態系統,比如OneAPI等,所以不必像競品芯片那樣去開發一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發者,無需像GPU那樣去學習CUDA、OpenCL,而是可以用Pragma和MPI這樣的標準編譯器方案。
AI編程上也是如此,InspireSemiconductor指出流行的AI框架,諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持,Linux也在操作系統支持的行列中。如此看來,InspireSemiconductor目前應該只提供了純硬件方案,而這樣的產品是否能在市面上取得成功,目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態了。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
英特爾
+關注
關注
61文章
10301瀏覽量
180434 -
谷歌
+關注
關注
27文章
6254瀏覽量
111377 -
數據中心
+關注
關注
18文章
5649瀏覽量
75011 -
RISC-V
+關注
關注
48文章
2886瀏覽量
52991
發布評論請先 登錄
相關推薦
熱點推薦
賽昉科技2025:引領RISC-V駛入數據中心深水區
2025年,是RISC-V從技術走向場景的關鍵一年。賽昉科技始終相信:唯有落地,才能創造真實價值。我們以規模化商用為錨點,推動RISC-V深入數據中心核心、走進千行百業。在此,向您呈上我們這一
RISC-V實現數據中心應用突破,賽昉科技BMC芯片重磅亮相
電子發燒友原創 章鷹 近期,在珠海舉辦的RISC-V產業大會上,賽昉科技展示了面向數據中心、邊緣計算及智能終端的全棧產品與成熟應用,其中一款產品引起了記者的注意,這款BMC芯片在11月19日的英特爾
2025 RISC-V產業發展大會 | 賽昉科技全景展示規模化商用成果
2025年11月24日,RISC-V產業發展大會在珠海開幕。賽昉科技以“推動RISC-V規模化商用”為核心主題,重點展示了面向數據中心、邊緣計算及智能終端的全棧產品與成熟應用,全面呈現
賽昉科技BMC全鏈路解決方案亮相英特爾生態大會,加速RISC-V數據中心管理芯片規模化應用
RISC-V架構創新應用的堅定推動者,賽昉科技攜BMC解決方案全新亮相英特爾“數據中心基礎設施”展區,并且受邀在“硬件基礎架構與生態”論壇上發表演講。賽昉科技解決方
英特爾攜本地生態伙伴發布雙路冷板式全域液冷服務器,引領數據中心散熱與能效革新
服務器。該創新方案由全本地生態賦能,實現了關鍵熱源的高比例液冷覆蓋,在提升可靠性與能效的同時,顯著降低能耗與運維成本,為數據中心散熱與能效樹立全新標桿。
發表于 11-19 21:21
?1569次閱讀
賽昉科技重磅發布新產品,RISC-V實現數據中心規模化商用突破
2025年11月14日,中國香港——賽昉科技隆重發布首款基于RISC-V架構的數據中心管理芯片“獅子山芯”。作為一款具有里程碑意義的產品,“獅子山芯”成功實現了RISC-V在數據中心領
賽昉科技RISC-V“獅子山芯”打入數據中心市場,超聚變、英特爾頂力支持
規模化商業落地,為中國的算力基礎設施發展注入了新的核心動能。 ? 本次產品發布備受矚目,賽昉科技創始人兼CEO徐滔、賦生資本創始人李家杰博士、香港投資管理有限公司行政總裁陳家齊女士、超聚變董事長兼CEO劉宏云、英特爾中國區數據中心
RISC-V創新中心與達摩院合作簽約
10月30日,RISC-V創新中心與達摩院合作簽約暨創新發展交流會在蘇州市集成電路創新中心隆重舉行,來自全國各地的重點企業、科研機構、行業協會、投資機構等代表出席活動,共話RISC-V
聚焦液冷痛點:英特爾UQD互換性認證助力數據中心高效發展
認證的技術創新之道,及其對降低數據中心運維復雜度、提升系統可靠性、助力液冷產業規模化的重要性。 英特爾數據中心與人工智能集團副總裁兼中國區總經理陳葆立表示:“作為AI模型運行和硬件部署的核心場景,
構建基于 RISC-V 平臺的 TEE 架構:RV-ACRN Hypervisor 的實踐與展望
模型,支持實時性、關鍵安全性與多操作系統共存。? 2025 年 7 月 18 日,在第五屆(2025)RISC-V 中國峰會的軟件與生態系統分論壇上,英特爾的李海程(HaiCheng Li)分享了他們
發表于 07-18 14:55
?5003次閱讀
RISC-V 在數據中心軟件生態系統中的機遇與挑戰
RISC-V 作為一種開源指令集架構,憑借其靈活性、可擴展性和開源特性,在數據中心領域的應用正從探索階段逐步向實際落地推進。目前,RISC-V 在數據中心的應用處于 “能跑通但需優化”
發表于 07-18 13:38
?5381次閱讀
英特爾2025年Q1營收127億美元,數據中心與AI業務可圈可點
? 今日,英特爾公布2025年第一季度財報。數據顯示,英特爾第一季度營收達127億美元,超出預期指引,產品業務營收為118億美元,其中數據中心
端側AI、數據中心,RISC-V已“上桌”
電子發燒友網報道(文/梁浩斌)從低功耗、低成本應用,邁向高性能、高算力,是RISC-V發展過程中的必經之路。隨著RISC-V生態的發展,包括工具鏈、IP核的進一步完善,RISC-V正在加速沖擊高性能
英特爾至強6處理器助力數據中心整合升級
繼去年9月重磅推出英特爾 至強 6900性能核處理器后,英特爾進一步擴充至強6產品家族,于近期發布了包括至強6700性能核處理器及至強6500性能核處理器在內的多款新品,以更豐富的產品組合、卓越性能與出色能效,應對橫跨數據中心、
英特爾至強6:如何煉就數據中心“全能型選手”
面對數據中心領域日益激烈的競爭,英特爾緊抓核心產品,繼去年推出128核的至強6900P之后,近期又添“新兵”——至強6700P和至強6500P,進一步豐富了至強6產品線。英特爾至強6性能核處理器專為
英特爾與谷歌開始為RISC-V進軍數據中心鋪路
評論