當(dāng)?shù)貢r(shí)間12月3日,亞馬遜在“AWS re:invent”大會(huì)上正式發(fā)布了自主研發(fā)的第二代基于Arm架構(gòu)的服務(wù)器芯片Graviton2,同時(shí)公布了去年發(fā)布的云端AI推理芯片Inferentia的最新進(jìn)展。
亞馬遜AWS在此次大會(huì)上推出了Inf1實(shí)例,該實(shí)例由Inferentia芯片提供支持,是一個(gè)在云端為AI推理提供支持的實(shí)例,AWS CEO Andy Jassy稱之為云中可用的成本最低的推理產(chǎn)品。
Andy Jassy 指出:使用云服務(wù)為AI解決方案提供動(dòng)力的運(yùn)營(yíng)成本絕大多數(shù)來(lái)自推理,而推理芯片可能會(huì)很昂貴,并且要求低延遲和高吞吐量。許多企業(yè)都在模型訓(xùn)練的定制芯片上投入了大量精力,盡管常規(guī) CPU 上已經(jīng)能夠較好地執(zhí)行推理運(yùn)算,但定制芯片的效率明顯更高。“與Nvidia G4實(shí)例相比,Inf1具有更低的延遲,吞吐量將提高3倍,并且每個(gè)實(shí)例的成本降低40%。”
Inferentia芯片還將由Annapurna Labs提供支持,該芯片企業(yè)是2015年被以色列AWS收購(gòu)的。Inferentia芯片擁有4的個(gè)NeuronCore,可以提供128TOPS的算力,而每個(gè)Inf1實(shí)例可以提供2000 TOPS的算力。
與 EC4 上的常規(guī) G4 實(shí)例相比,Inferentia 能夠讓 AWS 帶來(lái)更低的延時(shí)、三倍的吞吐量、且降低 40% 單次的成本。
Inf1實(shí)例目前已經(jīng)上市,并將與PyTorch,MXNet和TensoRFlow集成。不過(guò),目前其僅可在EC2計(jì)算服務(wù)中使用,但明年,Inf1將可以用于EKS實(shí)例和Amazon的SageMaker,來(lái)進(jìn)行機(jī)器學(xué)習(xí)的推理運(yùn)算。
-
ARM
+關(guān)注
關(guān)注
135文章
9553瀏覽量
392007 -
AI
+關(guān)注
關(guān)注
91文章
39808瀏覽量
301479 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2731瀏覽量
85752
發(fā)布評(píng)論請(qǐng)先 登錄
亞馬遜云科技推出兩項(xiàng)Amazon Lambda新功能 進(jìn)一步應(yīng)對(duì)復(fù)雜應(yīng)用場(chǎng)景
亞馬遜云科技推出全新的Amazon AI Factories 將客戶現(xiàn)有基礎(chǔ)設(shè)施轉(zhuǎn)化為高性能AI環(huán)境
亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4倍
亞馬遜新一代自研服務(wù)器芯片Graviton5問(wèn)世,性能提升25%
亞馬遜獲取商品評(píng)論的API接口
英特爾助力阿里云推出多款云實(shí)例和存儲(chǔ)方案
亞馬遜云科技推出Amazon Quick Suite,引領(lǐng)Agentic AI驅(qū)動(dòng)的工作新范式
亞馬遜云科技在中國(guó)區(qū)域推出Amazon Graviton4實(shí)例 以自研芯片驅(qū)動(dòng)企業(yè)算力升級(jí)
亞馬遜云科技現(xiàn)已上線OpenAI開(kāi)放權(quán)重模型
亞馬遜云科技推出Amazon Nova Act SDK預(yù)覽版,加速瀏覽器自動(dòng)化Agent落地
今日看點(diǎn)丨亞馬遜上海AI研究院解散;索尼擬出售以色列芯片部門(mén)
單片機(jī)項(xiàng)目實(shí)例:電阻觸摸屏_XPT2046驅(qū)動(dòng)芯片資料
F1?與亞馬遜云科技聯(lián)合推出全新在線體驗(yàn) 車(chē)迷可親手打造專屬賽道
亞馬遜云科技發(fā)布“3+2”合作伙伴戰(zhàn)略 與合作伙伴加速前行
亞馬遜推出基于Inferentia芯片的Inf1實(shí)例
評(píng)論