伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為何AI數(shù)據(jù)中心的系統(tǒng)架構(gòu)師首選Arm平臺

Arm社區(qū) ? 來源:Arm社區(qū) ? 2026-03-24 10:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

過去十多年,云基礎(chǔ)設(shè)施通過“抽象化”實現(xiàn)擴(kuò)展,借助標(biāo)準(zhǔn)化服務(wù)器、虛擬化資源及軟件層,有效彌合了硬件層面的差異。這種模式之所以行之有效,是因為部分工作負(fù)載能夠容忍一定程度的低效。然而,人工智能 (AI) 工作負(fù)載無法容忍低效,也因此暴露出了傳統(tǒng)架構(gòu)在供電、散熱、算力密度、內(nèi)存帶寬及系統(tǒng)整體性能方面的短板。

本質(zhì)上,AI 重新定義了“優(yōu)秀”基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)。相應(yīng)地,平臺設(shè)計的重心也從注重單一的芯片或服務(wù)器,轉(zhuǎn)向了打造機(jī)架級、可擴(kuò)展的系統(tǒng),在功耗和預(yù)算有限的前提下,實現(xiàn)高效擴(kuò)展。而這一轉(zhuǎn)變背后的原因在于,推理與智能體 AI 工作負(fù)載持續(xù)增長且不間斷運行,對高密度、全天候在線的算力需求正快速提升。

Futurum 在《Arm 處于 AI 和數(shù)據(jù)中心變革的中心》報告中,把這一轉(zhuǎn)變稱為邁向“系統(tǒng)級協(xié)同”。設(shè)計的關(guān)鍵不再是堆多少算力,而是平臺能不能有效地把加速器、CPU、內(nèi)存、網(wǎng)絡(luò)和軟件協(xié)同起來。

正因如此,業(yè)界正加速邁向定制化機(jī)架級系統(tǒng)設(shè)計:即圍繞 AI 負(fù)載特性、功耗波動和持續(xù)利用率來進(jìn)行端到端設(shè)計的平臺。越來越多的架構(gòu)師開始重新思考計算底層設(shè)計,選擇基于 Arm 架構(gòu)來解決現(xiàn)代 AI 平臺面臨的多重約束。

AI 促使行業(yè)重構(gòu):轉(zhuǎn)向定制化機(jī)架級系統(tǒng)

這一轉(zhuǎn)變的核心原因,并非通用型標(biāo)準(zhǔn)化基礎(chǔ)設(shè)施無法承載 AI,而是碎片化的系統(tǒng)設(shè)計,在 AI 規(guī)模化部署時,終將轉(zhuǎn)化為真實可感的成本代價。

AI 工作負(fù)載在計算、內(nèi)存、網(wǎng)絡(luò)、存儲及軟件各環(huán)節(jié)緊密耦合。CPU 拖后腿,昂貴的加速器就會空等;功耗和散熱波動,利用率就會下滑;數(shù)據(jù)管道、調(diào)度、編排未能針對平臺調(diào)優(yōu),吞吐量就不可預(yù)測。峰值性能依然重要,但穩(wěn)定性、每瓦性能和系統(tǒng)整體平衡性更關(guān)鍵。

Futurum 指出,超大規(guī)模云服務(wù)提供商正進(jìn)行結(jié)構(gòu)性調(diào)整,旨在實現(xiàn)算力的指數(shù)級增長,同時避免能耗的同步激增。Futurum 引用 Arm 的數(shù)據(jù)指出,到 2025 年末,出貨到頭部超大規(guī)模云服務(wù)提供商的算力中,有近 50% 是基于 Arm 架構(gòu)。

架構(gòu)師現(xiàn)在不再只看紙面跑分,而是更關(guān)心 AI 平臺在實際應(yīng)用中能否長期可靠地運行智能體 AI 和連續(xù)推理工作負(fù)載,比如:

長時間高負(fù)載下,系統(tǒng)表現(xiàn)如何?

在實際環(huán)境中,功耗限制和散熱條件如何影響性能曲線?

在機(jī)架級系統(tǒng)中,計算層如何確保加速器能持續(xù)獲得穩(wěn)定的數(shù)據(jù)供給,而非僅停留在紙面參數(shù)上?

當(dāng)能效、可擴(kuò)展性與系統(tǒng)平衡性成為首要原則時,重新審視 CPU 底層架構(gòu)就成了必然。也正因為此,Arm 憑借領(lǐng)先的架構(gòu)和完善的生態(tài),正是這場行業(yè)變革的核心所在。

在數(shù)據(jù)中心領(lǐng)域,Arm Neoverse 平臺是推動這一轉(zhuǎn)型的核心引擎。亞馬遜云科技、Google、微軟、NVIDIA 等頭部超大規(guī)模云服務(wù)提供商與 AI 領(lǐng)軍企業(yè),都在基于 Arm 架構(gòu)或采用 Arm 計算平臺進(jìn)行產(chǎn)品研發(fā)。Arm 的模式既能支持定制化系統(tǒng)設(shè)計,又能保持跨平臺、跨生態(tài)、跨軟件的一致性。對于想要構(gòu)建高集成度平臺、又不愿被單一技術(shù)路徑綁定的團(tuán)隊而言,這種靈活性至關(guān)重要。

智能體 AI 與持續(xù)推理,

重塑規(guī)模化算力的經(jīng)濟(jì)邏輯

隨著 AI 與通用計算工作負(fù)載的融合,AI 工作負(fù)載正在發(fā)生變化,基礎(chǔ)設(shè)施也需隨之調(diào)整,以支持多樣化的工作負(fù)載特性。

行業(yè)重心正在轉(zhuǎn)向智能體 AI,而智能體 AI 本質(zhì)上就是一個連續(xù)推理系統(tǒng)。智能體并不是簡單地給出一個答案, 而是會規(guī)劃、調(diào)用工具、檢索數(shù)據(jù)、驗證結(jié)果,如此循環(huán)往復(fù)。由此便形成了連續(xù)推理模式:穩(wěn)定不間斷的詞元 (token) 生成任務(wù),請求類型趨于多元化,圍繞加速器的編排和數(shù)據(jù)遷移任務(wù)變得更繁重。

在智能體 AI 里,CPU 不再是配角, 而是整個 AI 系統(tǒng)的控制中樞。CPU 負(fù)責(zé)協(xié)調(diào)控制、調(diào)度任務(wù)、管理 IO、處理網(wǎng)絡(luò)與存儲服務(wù)、執(zhí)行安全策略,并在模型、上下文及工具鏈不斷演進(jìn)的過程中,維持整個系統(tǒng)的平衡。

以承載大語言模型 (LLM) 的服務(wù)為例,它可能同時處理成百上千的并發(fā)請求。就算加速器負(fù)責(zé)核心計算,CPU 也要承擔(dān)請求權(quán)限控制、分詞和預(yù)處理、批處理和隊列調(diào)度、數(shù)據(jù)遷移編排,以及針對模型權(quán)重與 KV 緩存的數(shù)據(jù)路徑協(xié)調(diào)等。到了智能體工作流,CPU 的工作負(fù)擔(dān)進(jìn)一步擴(kuò)展,還要承擔(dān)工具調(diào)用、檢索流程、結(jié)構(gòu)化輸出驗證、多步調(diào)度等持續(xù)運行的任務(wù)。

這一切都表明,CPU的重要性遠(yuǎn)超許多團(tuán)隊的預(yù)期。如果 CPU 跟不上編排節(jié)奏,數(shù)據(jù)遷移、處理流程和加速器都會被“卡住”,面臨結(jié)構(gòu)性的閑置風(fēng)險。

融合型 AI 數(shù)據(jù)中心的建設(shè),彰顯了 Arm 架構(gòu)的強(qiáng)勁勢頭

Arm 的發(fā)展勢頭正在加快。在業(yè)內(nèi)領(lǐng)先的集成式 AI 系統(tǒng)中,基于 Neoverse 平臺的 CPU 被廣泛用于智能體推理密集型系統(tǒng)的編排層,尤其適合追求高能效、可預(yù)測擴(kuò)展能力和大規(guī)模部署的應(yīng)用場景。

獨立測試也印證了現(xiàn)代 CPU 基礎(chǔ)平臺在“AI 相關(guān)”工作負(fù)載中的價值。Futurum 旗下 Signal65 的獨立基準(zhǔn)測試對比了基于 Arm Neoverse 平臺的 Amazon Graviton4 與同級的 AMDIntel EC2 實例,結(jié)果顯示:在生成式 AI (Llama-3.1-8B)、數(shù)據(jù)庫 (Redis)、機(jī)器學(xué)習(xí) (XGBoost)、網(wǎng)絡(luò) (Nginx) 等測試的各種工作負(fù)載中,基于 Neoverse 平臺的 Graviton4 在性能和性價比方面大幅領(lǐng)先。

測試結(jié)果直接反映了智能體 AI 數(shù)據(jù)中心的現(xiàn)狀:LLM、檢索層、緩存、Web/API、傳統(tǒng)機(jī)器學(xué)習(xí)等全都處于智能體系統(tǒng)的關(guān)鍵路徑上,只有當(dāng) CPU 兼具速度與能效時,整體才能更好地擴(kuò)展。

最新的機(jī)架級 AI 系統(tǒng)在架構(gòu)設(shè)計上,均采用定制化加速器層以及基于 Arm 架構(gòu)的 CPU 層的組合,由后者承擔(dān)調(diào)度編排、數(shù)據(jù)遷移與智能體推理預(yù)處理等關(guān)鍵任務(wù)。NVIDIA Grace Hopper、Grace Blackwell 等系列產(chǎn)品,將 NVIDIA GPU 與基于 Neoverse 架構(gòu)的 Grace CPU 深度融合。而其最新機(jī)架級平臺 Vera Rubin NVL72,更是在系統(tǒng)內(nèi)集成 72 顆 Rubin GPU 與 36 顆基于 Arm 架構(gòu)的 Vera CPU,專為交互式、深度推理型智能體 AI 優(yōu)化,顯著降低推理成本。

亞馬遜云科技也在走同樣的系統(tǒng)級路線:Amazon Trainium3 UltraServer 把 Trainium3 加速器芯片與 Graviton CPU 結(jié)合,強(qiáng)化了“融合型”設(shè)計理念:將加速器與定制的高性能、高能效 CPU 相匹配,以實現(xiàn)高效擴(kuò)展。

“提供更優(yōu)選擇”不再是偏好,而是硬性要求

AI 系統(tǒng)迭代太快,固定架構(gòu)已無法適配其發(fā)展節(jié)奏,因此為客戶提供更優(yōu)選擇已成為風(fēng)險管理的必要舉措。

系統(tǒng)架構(gòu)師想要的是:

平臺能適應(yīng)不同代的硬件、多樣的工作負(fù)載配置及各異的部署環(huán)境;

軟件可移植,以降低系統(tǒng)變更成本。

與此同時,系統(tǒng)架構(gòu)師希望避免因過度依賴單一廠商,而導(dǎo)致在模型組合變化、業(yè)務(wù)規(guī)模擴(kuò)張或新需求出現(xiàn)時陷入被動。在智能體時代尤其如此:推理形態(tài)不斷變化,上下文更長、工具調(diào)用更多、多模態(tài)輸入更頻繁、全天候工作負(fù)載更普遍,效率和平衡遠(yuǎn)比峰值跑分重要。

Arm 架構(gòu)在提升系統(tǒng)性能的同時,保持跨平臺一致性。Arm 架構(gòu)不僅引入了現(xiàn)代 AI 基礎(chǔ)設(shè)施所需的關(guān)鍵特性,而且擁有強(qiáng)大的軟件生態(tài)支持。Arm 計算子系統(tǒng) (CSS) 提供經(jīng)過驗證的基礎(chǔ)設(shè)施級模塊,既加速了芯片開發(fā),又保留了合作伙伴間的差異化與選擇權(quán)。對于所有基于 Arm 架構(gòu)的平臺,一致性貫穿始終,云工作負(fù)載遷移至 Arm 平臺也極為便捷。同時,在軟件層面,Arm 生態(tài)助力團(tuán)隊在不同環(huán)境與平臺間擁有一致連貫的基礎(chǔ),從而加速開發(fā)進(jìn)程,無需重寫所有代碼。

智能體 AI 經(jīng)濟(jì)重塑 CPU 選擇格局,Arm Neoverse 平臺成頭部廠商首選

系統(tǒng)架構(gòu)師之所以傾向于 Arm 平臺,因為它精準(zhǔn)匹配定制AI 系統(tǒng)的核心需求:能效、可擴(kuò)展性及每瓦性能。能效重要,因為功耗和預(yù)算是硬上限;系統(tǒng)平衡和 CPU 性能重要,因為加速器閑置成本極高;一致性重要,因為 AI 基礎(chǔ)設(shè)施變化快、跨環(huán)境部署日益增多。

在融合型智能體 AI 數(shù)據(jù)中心里,面對持續(xù)推理的應(yīng)用需求,上述優(yōu)先事項變成了上線即需滿足的硬性指標(biāo)。智能體系統(tǒng)不只需要能生成詞元的加速器,更需要以 CPU 為核心的編排能力,在網(wǎng)絡(luò)、存儲、調(diào)度、安全層面,持續(xù)、高效、大規(guī)模地把資源利用起來。

Arm 如今的強(qiáng)勁增長正源于此:Neoverse 正成為智能體時代的 CPU 基礎(chǔ)平臺,作為計算頭節(jié)點,是讓 AI 系統(tǒng)保持高效、一致并面向未來的核心控制中樞。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9570

    瀏覽量

    392681
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5687

    瀏覽量

    75138
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40320

    瀏覽量

    301900

原文標(biāo)題:為何 AI 數(shù)據(jù)中心的系統(tǒng)架構(gòu)師首選 Arm 平臺

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Arm親自下場!自研首款數(shù)據(jù)中心AGI CPU發(fā)布!

    Arm今日發(fā)布首款由 Arm 設(shè)計的數(shù)據(jù)中心 CPU——Arm AGI CPU,專為代理式 AI 基礎(chǔ)設(shè)施打造,可實現(xiàn)單機(jī)架性能達(dá)到 x86
    的頭像 發(fā)表于 03-25 08:39 ?1058次閱讀
    <b class='flag-5'>Arm</b>親自下場!自研首款<b class='flag-5'>數(shù)據(jù)中心</b>AGI CPU發(fā)布!

    1分鐘帶你了解數(shù)據(jù)中心供電架構(gòu) #電子元器件 #數(shù)據(jù)中心 #供電架構(gòu)

    數(shù)據(jù)中心
    沛城芯動力
    發(fā)布于 :2026年02月03日 15:39:04

    Arm架構(gòu)計算平臺驅(qū)動融合型AI數(shù)據(jù)中心變革

    的意義遠(yuǎn)不止于一個統(tǒng)計數(shù)字,更重要的是它們構(gòu)成了融合型人工智能 (AI) 數(shù)據(jù)中心這一新型基礎(chǔ)設(shè)施的計算核心。從云原生服務(wù)到最具挑戰(zhàn)性的 AI 工作負(fù)載,超大規(guī)模云服務(wù)提供商正逐步將基于 Ar
    的頭像 發(fā)表于 12-15 14:51 ?602次閱讀

    Arm Neoverse平臺集成NVIDIA NVLink Fusion

    生態(tài)系統(tǒng),實現(xiàn)全緩存一致性與高帶寬互連。 隨著 AI 數(shù)據(jù)中心Arm Neoverse 的需求持續(xù)增長,客戶在將工作負(fù)載加速器連接至 Arm
    的頭像 發(fā)表于 11-26 11:08 ?518次閱讀

    偉創(chuàng)力重磅發(fā)布全球首款面向千兆瓦級數(shù)據(jù)中心AI基礎(chǔ)設(shè)施平臺

    偉創(chuàng)力重磅發(fā)布全球首款面向千兆瓦級數(shù)據(jù)中心AI基礎(chǔ)設(shè)施平臺平臺集成了電源和冷卻產(chǎn)品、計算能力和服務(wù),專為AI和高性能計算而設(shè)計,幫助
    的頭像 發(fā)表于 10-23 15:08 ?841次閱讀

    賦能人工智能未來:ADI宣布支持800 VDC數(shù)據(jù)中心架構(gòu)

    , Inc. (ADI)推出創(chuàng)新解決方案,為數(shù)據(jù)中心下一代800 VDC架構(gòu)提供有力支持。該系列解決方案包含高可靠性熱插拔與一級電源產(chǎn)品,旨在實現(xiàn)安全、高效且智能的配電,精準(zhǔn)滿足現(xiàn)代AI工廠
    的頭像 發(fā)表于 08-28 21:18 ?1143次閱讀
    賦能人工智能未來:ADI宣布支持800 VDC<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>架構(gòu)</b>

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    引領(lǐng)AI時代網(wǎng)絡(luò)變革:睿海光電的核心競爭力 在AI時代,數(shù)據(jù)中心正經(jīng)歷從傳統(tǒng)架構(gòu)AI工廠與AI
    發(fā)表于 08-13 19:01

    華為面向拉美地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡(luò)方案

    在華為數(shù)據(jù)通信創(chuàng)新峰會2025拉美站期間,以“星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時代新動能”為主題的分論壇上,華為面向拉美地區(qū)發(fā)布全新升級的星河AI
    的頭像 發(fā)表于 08-11 10:42 ?2400次閱讀

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中扮演著至關(guān)重要的角色,它通過深度解析PCIe總線的物理層、鏈路層、事務(wù)層及應(yīng)用層協(xié)議,幫助運維人員、硬件工程系統(tǒng)架構(gòu)師優(yōu)化性能、診斷故障、驗證設(shè)計合規(guī)
    發(fā)表于 07-29 15:02

    中型數(shù)據(jù)中心應(yīng)用平臺與差分晶體振蕩器參數(shù)對照中型數(shù)據(jù)中心應(yīng)用平臺與差分晶體振蕩器參數(shù)對照

    中型數(shù)據(jù)中心對高頻、低抖動、寬溫與多電壓晶振的需求日益提升,F(xiàn)CO系列差分晶體振蕩器憑借豐富封裝、輸出邏輯選擇與優(yōu)異相位抖動性能,為網(wǎng)絡(luò)、存儲、服務(wù)器與邊緣系統(tǒng)提供穩(wěn)定的時鐘解決方案。FCO-2L 到 FCO-7L 系列,已成為新一代
    發(fā)表于 07-10 14:11

    中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案

    對時鐘源的穩(wěn)定性與抖動性能要求顯著提升,差分晶體振蕩器在其中扮演著核心角色。 中型數(shù)據(jù)中心典型案例 1. 大型制造企業(yè)工業(yè)數(shù)據(jù)中心 應(yīng)用背景: 服務(wù)于制造集團(tuán)的MES系統(tǒng)、IIoT平臺
    發(fā)表于 07-01 16:33

    光纖為何AI就緒型數(shù)據(jù)中心的基石?

    康普數(shù)據(jù)中心業(yè)務(wù)部大中國區(qū)銷售總監(jiān)?劉偉崗 隨著人工智能(AI)在各行各業(yè)加速落地應(yīng)用,企業(yè)領(lǐng)導(dǎo)者也開始從根本上重新思考數(shù)據(jù)中心的建設(shè)和運營方式。同樣,AI在中國市場勢頭正猛,各行業(yè)正
    的頭像 發(fā)表于 06-13 17:07 ?1298次閱讀

    是德科技推出AI數(shù)據(jù)中心構(gòu)建器以驗證和優(yōu)化網(wǎng)絡(luò)架構(gòu)和主機(jī)設(shè)計

    : KEYS )推出Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器,這是一款先進(jìn)的軟件套件,通過模擬真實工作負(fù)載來評估新算法、組件和協(xié)議對AI訓(xùn)練性能的影響。KAI數(shù)據(jù)中心構(gòu)建器的工
    的頭像 發(fā)表于 04-10 08:50 ?680次閱讀

    是德科技推出AI數(shù)據(jù)中心構(gòu)建器

    是德科技(NYSE:KEYS)推出Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器,這是一款先進(jìn)的軟件套件,通過模擬真實工作負(fù)載來評估新算法、組件和協(xié)議對AI訓(xùn)練性能的影響。KAI數(shù)據(jù)中心
    的頭像 發(fā)表于 04-07 11:06 ?1051次閱讀

    適用于數(shù)據(jù)中心AI時代的800G網(wǎng)絡(luò)

    ,成為新一代AI數(shù)據(jù)中心的核心驅(qū)動力。 AI時代的兩大數(shù)據(jù)中心AI工廠與AI
    發(fā)表于 03-25 17:35