隨著人工智能 (AI) 工作負載在復雜性和規(guī)模方面的激增,傳統(tǒng)的系統(tǒng)級芯片 (SoC) 模式正面臨三重挑戰(zhàn)——能效低下、性能瓶頸和產品上市時間延長。頭部云服務提供商曾主導的單芯片設計領域已無法滿足現(xiàn)代 AI 基礎設施的發(fā)展需求。
在即將于下周拉開帷幕的 2025 年 OCP 全球峰會上,Arm 將重點聚焦一大轉變:由Arm 計算子系統(tǒng) (Compute Subsystems, CSS)和芯粒系統(tǒng)架構 (Chiplet System Architecture, CSA)所賦能的芯粒創(chuàng)新,正為芯片提供商創(chuàng)造新的機遇,這些企業(yè)無需具備頭部云服務提供商的規(guī)模,也可構建 AI 優(yōu)化的設計。
從單芯片到模塊化 AI 芯片
多年來,全定制 SoC 主導著高端 AI 基礎設施。計算單元、內存控制器、互連系統(tǒng)和加速器等都集成在一個單晶粒 (die) 上。雖然這種設計可確保嚴格的控制,并帶來性能優(yōu)勢,但也存在顯著的利弊權衡,包括:
隨著工藝節(jié)點不斷突破極限,功耗和散熱成本持續(xù)上升;
大型異構模塊的驗證和確認相對復雜;
設計、工具開發(fā)和制造的交付時間長。
而采用芯粒技術的計算,則通過將系統(tǒng)分解為更小的專用晶粒(包括計算、內存、I/O、加速器),讓 SoC 架構師和設計人員能夠靈活搭配組件,并按需擴展,以實現(xiàn)產品的快速迭代。目前,這種模塊化仍有其局限性,例如設計的碎片化、標準化互連的缺乏、IP 復用的挑戰(zhàn),以及較大的前期風險和成本。
解題關鍵:Arm CSS 和 CSA 模式
Arm 正通過兩個基本框架彌合差距:
CSS:這是一套整合了經過預先驗證的高性能 IP 構建模塊的計算子系統(tǒng),涵蓋計算核心、AI 加速器、內存子系統(tǒng)等,其設計、驗證和性能特性已在真實或仿真芯片中得到驗證。通過使用 CSS,設計人員無需從頭開始打造每個模塊,也無需再次驗證其可行性;而能直接利用成熟且經優(yōu)化的組件。
CSA:這是一個開放且以標準為導向的架構,用于實現(xiàn)芯粒在不同供應商間的互連、通信與集成。CSA 定義了電氣、物理和協(xié)議層的兼容性,以便不同來源的 IP(例如,來自合作伙伴 A 的加速器和來自代工廠 B 的內存晶粒)可以在共享平臺上可靠地進行互操作。
CSS 和 CSA 讓 Socionext、Rebellions 等芯片提供商實現(xiàn)定制的 AI 優(yōu)化芯片,其性能可媲美頭部云服務提供商的設計方案,與此同時所承擔的風險更低、開發(fā)周期更短,且靈活性更高。芯片提供商可根據(jù)其具體的工作負載需求(如視覺模型、推理引擎和多租戶實例)靈活選擇計算模塊、加速器、內存類型及集成路徑,而非受制于單片設計的權衡取舍中。
OCP 助力加速行業(yè)發(fā)展
開放計算項目 (Open Compute Project, OCP) 長期以來是開放硬件協(xié)作、模塊化和高效率的核心陣地,這些原則與芯粒技術的革新密切相關。在 2025 年 OCP 全球峰會上,Arm 不僅將展示其技術理論架構,還會通過實際案例,生動呈現(xiàn)云服務提供商、OEM 廠商和芯片提供商如何結合使用 CSS 和 CSA,打造面向未來需求的 AI 基礎設施。
OCP 合作伙伴所獲得的主要優(yōu)勢包括:
靈活性:針對特定區(qū)域的功耗、散熱或可靠性限制,靈活定制芯片;
更低的總體擁有成本 (TCO):通過供應鏈可選性降低 TCO,即能夠從多家代工廠采購芯粒或晶粒,并隨著產量的擴大靈活組合晶粒,而非受制于單一供應商;
更快的上市時間:經過驗證的 CSS 模塊和標準化的互連使得大部分設計工作得以“預先完成”,從而實現(xiàn)更快速的原型設計、測試和部署。
業(yè)務影響及未來展望
對于 AI 基礎設施建設者來說,無論是云服務提供商、OEM 廠商還是剛剛涉足 AI 領域的芯片公司,CSS 和 CSA 方法都能幫助他們實現(xiàn)以下的成果:
每瓦性能的提升:計算和內存被置于最高效的位置,避免資源浪費。
設計風險的降低:復用經過驗證的 IP,以及利用標準互連技術。
供應鏈彈性的提高:模塊化設計使更換供應商、擴展晶粒產量或首選代工廠工藝節(jié)點變得更為可行。
設計周期的加速:設計周期的縮短能實現(xiàn) AI 模型、特性集和部署的快速迭代。
這不僅僅是芯片架構,它更是 AI 時代企業(yè)實現(xiàn)業(yè)務敏捷性的關鍵杠桿。
了解更多信息
在 2025 年 OCP 全球峰會上,Arm 將舉辦系列會議和技術簡報會,現(xiàn)場展示 CSS 和 CSA 的實際應用。無論你是探索 AI 硬件未來的芯片設計人員、基礎設施架構師還是云服務提供商,這都為你突破現(xiàn)有局限、見證無限可能提供了絕佳契機。
數(shù)據(jù)中心的未來仰賴于各種規(guī)模的創(chuàng)新,Arm 始終致力于讓所有企業(yè)(不僅是頭部云服務提供商)都有打造定制 AI 芯片的能力!
-
ARM
+關注
關注
135文章
9552瀏覽量
391834 -
內存
+關注
關注
9文章
3209瀏覽量
76357 -
AI芯片
+關注
關注
17文章
2126瀏覽量
36766
原文標題:探索芯粒革新,Arm 計算子系統(tǒng)平臺推動定制 AI 芯片普及
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
軟件定義的硬件輔助驗證如何助力AI芯片開發(fā)
Arm Neoverse平臺集成NVIDIA NVLink Fusion
Arm Flexible Access方案引入Armv9邊緣AI計算平臺
Arm正式取消Cortex命名!CPU向著高算力進發(fā),Lumex CSS平臺加持!
全新Arm Lumex CSS平臺實現(xiàn)兩位數(shù)性能提升
深入解析面向不同市場的多樣化Arm計算子系統(tǒng)
Arm計算子系統(tǒng)平臺推動定制AI芯片普及
評論