無論是移動應(yīng)用程序或數(shù)字商務(wù)等可見應(yīng)用程序,還是航空公司定價算法或每次刷卡時激活的欺詐檢測系統(tǒng)等幕后流程,AI 都已成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧S绕涫巧墒?AI,預(yù)計未來十年將以兩位數(shù)的速度持續(xù)增長,到 2032 年市場規(guī)模可能達(dá)到1 萬億美元以上。
AI 技術(shù)的發(fā)展推動了對更強(qiáng)大的處理器的需求,尤其是 GPU,是構(gòu)建 AI 基礎(chǔ)設(shè)施的重要組成部分。NVIDIA 在行業(yè)和市場占據(jù)著主導(dǎo)地位,AMD 也越來越受歡迎,但企業(yè)必須面對GPU 持續(xù)增加的功耗,部分型號甚至已經(jīng)超過1kW,這一趨勢也導(dǎo)致全球數(shù)據(jù)中心功耗大幅增加。預(yù)計在 2022 年至 2026 年間還將翻一番,容量已然成為公共事業(yè)提供商和企業(yè)面臨的主要挑戰(zhàn)。
目前,大約80% 的數(shù)據(jù)中心運營商面臨功率限制,許多運營商對每機(jī)架功率限制在 10-20 kW的范圍內(nèi)。雖然傳統(tǒng)方法證明,提高處理器性能和效率可以提高總功耗,但很多數(shù)據(jù)中心運營商已經(jīng)達(dá)到功率上限,這也對企業(yè)的持續(xù)創(chuàng)新和增長造成了阻礙。此外,擴(kuò)展機(jī)架空間或適應(yīng)特殊的冷卻方法通常成本高昂或受到空間和法規(guī)的限制;老化的服務(wù)器基礎(chǔ)設(shè)施(許多服務(wù)器使用時間超過 5 年)也不斷增加維護(hù)成本和安全風(fēng)險。
對此,最實用的解決方案是升級現(xiàn)有的基礎(chǔ)設(shè)施。及時的服務(wù)器更新能夠大幅整合機(jī)架空間,從而降低運營成本,回收電力預(yù)算,并支持部署能夠處理 AI 工作負(fù)載的現(xiàn)代服務(wù)器。在評估服務(wù)器更新時,運營商需要用新的方式來思考,只要新一代處理器的每瓦性能(即效率)提高,處理器功耗的增加就可以被接受,這意味著新服務(wù)器比舊服務(wù)器 “里程更長”。盡管最大機(jī)架功率預(yù)算有限并開始接近極限,通過專注于每機(jī)架的性能,企業(yè)可以優(yōu)化現(xiàn)有的電力和空間,使他們能夠從數(shù)據(jù)中心的局限性轉(zhuǎn)為更加專注于業(yè)務(wù)的增長和創(chuàng)新。
Ampere 的云原生處理器旨在提供橫向擴(kuò)展性能和領(lǐng)先的效率。AmpereOne 自研核是替代老舊服務(wù)器的最佳 CPU 選擇。在AmpereOne 效率白皮書中,詳細(xì)闡述了 AmpereOne 的效率優(yōu)勢,相較 AMD EPYC 9004 系列處理器,如何使云原生和 AI 工作負(fù)載的每機(jī)架性能提高 67%。
以下是 7 個開源工作負(fù)載,從 Web 服務(wù)器和負(fù)載均衡器到數(shù)據(jù)庫,再到緩存和內(nèi)存中數(shù)據(jù)存儲。它們在許多現(xiàn)代 Web 服務(wù)中頗受歡迎,因為它們通過緩存處理 web 流量管理、數(shù)據(jù)存儲和性能優(yōu)化。

在AI 計算時代,通過將 AI 推理工作負(fù)載添加到上述通用工作負(fù)載中,可以增強(qiáng)各個行業(yè)的產(chǎn)品和服務(wù)。下表展示了 AmpereOne 在機(jī)架級別的性能和效率,適用于推理工作負(fù)載,如推薦引擎(DLRM)、圖像處理(ResNet-50)以及以語言為中心的工作負(fù)載(Whisper和Llama3)。這些工作負(fù)載支持現(xiàn)代設(shè)施,例如聊天機(jī)器人、在電子商務(wù)網(wǎng)站上查看推薦的產(chǎn)品、在流媒體平臺上呈現(xiàn)“您可能喜歡的節(jié)目”,或者為直播電視流提供實時隱藏字幕。

對于前面提到的每機(jī)架可用功率有限的企業(yè)和服務(wù)提供商來說,實現(xiàn)每機(jī)架的最大性能尤為重要。即使是中等規(guī)模的企業(yè),由 AI 驅(qū)動的 web 服務(wù)也可以從 AmpereOne 中受益。與 AMD EPYC Genoa 8 個機(jī)架的輸出相比,AmpereOne 可以在不犧牲性能水平的情況下,將機(jī)架空間減少 38%,將功率預(yù)算降低 37%,并將購置成本降低 49%。以下代理 web 服務(wù)包括作為前端 Web 服務(wù)器的 NGINX、作為鍵值存儲的 Redis、作為內(nèi)存數(shù)據(jù)庫的 Memcached、作為關(guān)系數(shù)據(jù)庫的 MySQL,以及分別作為推薦引擎和聊天機(jī)器人的 AI 組件 DLRM 和 Llama3。

AmpereOne 可以通過更新老化的服務(wù)器來重新利用預(yù)算、空間和功率。我們展示了如何節(jié)約資本支出,如何通過降低功耗和管理開銷而實現(xiàn)運營支出的節(jié)省,在三年內(nèi)為企業(yè)節(jié)省大量 TCO。相較 AMD EPYC Bergamo,運營商可以節(jié)省 33% 的成本;與 AMD EPYC Genoa 相比,可節(jié)省高達(dá) 41% 的成本,這都?xì)w功于AmpereOne。

無論公司規(guī)模大小,“AI 海嘯” 將繼續(xù)降低企業(yè)大規(guī)模實施 AI 的準(zhǔn)入門檻。即使沒有資源去雇傭?qū)iT的 AI 團(tuán)隊,企業(yè)也可以通過服務(wù)提供商來開啟 AI 之旅,并迅速投入生產(chǎn)。因此,整合傳統(tǒng)基礎(chǔ)設(shè)施為 AI 擴(kuò)展釋放空間尤其重要。
-
處理器
+關(guān)注
關(guān)注
68文章
20255瀏覽量
252319 -
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301431
發(fā)布評論請先 登錄
NVIDIA技術(shù)助力光輪智能加速物理AI落地
疊層固態(tài)電容:小型化封裝,釋放PCB更多空間
ALVA推出“ AI + 空間計算智能運維平臺
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用
無人機(jī)飛控輕量化:合粵縮小體電容釋放空間,適配緊湊模組設(shè)計
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
愛芯元智AI原生處理器釋放智能生產(chǎn)力
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件
NVIDIA通過全新 Omniverse庫、Cosmos物理AI模型及AI計算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開啟新篇章
為AI計算釋放空間
評論