在過去十年中,云計算每年增長20%,成為了價值1萬億美元的巨大行業(yè)大約3000萬臺CPU服務器完成大部分處理工作,另外,減少碳排放這任務從根本上與增加數(shù)據(jù)中心的需求相悖,未經(jīng)過加速的工作負載都將會在CPU上進行處理在AI和云服務中。
在GTC 2023開發(fā)者大會上,英偉達向我們介紹了關于他在云計算領域的三個大動作。
首先,英偉達與微軟Azure、Google GCP和Oracle OCI三家云廠商合作推出了NVIDIA DGX Cloud。NVIDIA DGX Cloud是一項人工智能超級計算服務,它可以讓企業(yè)快速訪問為生成式人工智能和其他開創(chuàng)性應用訓練高級模型所需的基礎設施和軟件。通過一個瀏覽器,客戶就可以將英偉達DGX AI超級計算機實時接入公司。
其次,面向具有構建、優(yōu)化和運營定制大語言模型和生成式AI需求的客戶,英偉達推出云服務NVIDIA AI Foundations,提供語言、數(shù)據(jù)和生物學模型的定制服務。
同時,針對ChatGPT等大語言模型的推理訓練,英偉達推出了新的GPU H100。H100配備有94GB HBM3的顯存,可以支持參數(shù)規(guī)模達到1750億的GPT-3,并將大語言模型的處理成本降低一個數(shù)量級。
NVIDIA DGX Cloud將透過多個云端服務供應商提供,微軟Azure預計于下一季起托管DGX Cloud服務,包括Google Cloud等業(yè)者也將陸續(xù)開始供應服務,DGX Cloud執(zhí)行個體價格為每個執(zhí)行個體每月36,999美金起。
每個DGX Cloud執(zhí)行個體皆有8個NVIDIA H100或NVIDIA A100 80GB Tensor GPU,單一節(jié)點具備640GB 的GPU記憶體,并透過NVIDIA Networking技術提供高效能、低延遲網(wǎng)路,使多個執(zhí)行個體等同一個超大型GPU。
文章綜合和訊 、格隆匯APP、CNMO手機中國
-
云計算
+關注
關注
39文章
8023瀏覽量
144480 -
英偉達
+關注
關注
23文章
4090瀏覽量
99238 -
gtc
+關注
關注
0文章
74瀏覽量
4766
發(fā)布評論請先 登錄
英偉達5萬億市值背后,是一場賭上未來的燒錢競賽
企業(yè)級AI Agent王炸! 英偉達GTC將開源 NemoClaw
英偉達重磅出手!AI 推理存儲全面覺醒
今日看點:英偉達三季度營收達570億美元,云 GPU 已售罄;蔚來智駕芯片被曝首次技術外供
NVIDIA新聞:英偉達10億美元入股諾基亞 英偉達推出全新量子設備
傳英偉達自研HBM基礎裸片
今日看點丨英偉達H20芯片后不會在華再推出Hopper系列產(chǎn)品;AMD 確認采用臺積電 2nm 工藝 1. 傳英偉達計劃在上
立訊技術亮相英偉達GTC 2025大會
英偉達GTC2025亮點:NVIDIA認證計劃擴展至企業(yè)存儲領域,加速AI工廠部署
英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
黃仁勛GTC2025演講:人工智能的終極形態(tài)物理AI將徹底改變世界
GTC 2023:英偉達的三大云計劃
評論