據外媒報道,微軟發布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達旗艦處理器以及云服務競爭對手亞馬遜、谷歌同類產品的替代選擇。微軟稱,這款芯片是為 AI 推理規模化部署打造的高性能核心算力芯片。
2023年,微軟曾經發布人工智能芯片 Maia 100,該芯片始終未向云服務客戶開放租用服務,如今新一代芯片 Maia 200 正式亮相。微軟云與人工智能部門執行副總裁斯科特?格思里周一在博客中表示,這款全新芯片未來將 “面向更廣泛的客戶開放使用”。

微軟表示,Maia 200 在技術上實現了升級,能夠以更快的速度、更高的能效運行高性能 AI 模型。這款芯片集成超 1000 億個晶體管,4 比特精度下的算力可達 10 petaflops 以上,8 比特精度算力約 5 petaflops,相較上一代產品實現大幅提升。
該芯片采用臺積電的 3nm制程工藝,每臺服務器內部均集成四顆芯片,且通過以太網電纜實現連接,而非InfiniBand帶寬標準。同等價格下,這款芯片的性能相較同類產品提升 30%。微軟方面表示,單顆Maia 200的高帶寬內存配置,均高于亞馬遜云科技的第三代訓練型人工智能芯片以及谷歌的第七代張量處理單元。
斯科特?格思里還提到,微軟可將多達 6144 顆Maia 200芯片互連以實現高性能運算,同時降低能耗與總體擁有成本。微軟(Microsoft)表示,新款Maia 200芯片本周已在愛荷華州一處數據中心上線,并計劃在亞利桑那州的第2個據點投入使用。
對比英偉達最新發布的旗艦芯片Vera Rubin芯片,微軟的Maia 200芯片同樣采用3nm,并且采用高頻內存,與英偉達的芯片比較,Maia 200采用了HBM3E,屬于速度更慢的一代,英偉達的Vera Rubin采用HBM4, 相較于前一代HBM3e,HBM4 在多個關鍵技術維度上實現了顯著升級。

HBM3e接口位寬為1024-bit, HBM4接口位寬提升至 2048-bit, 在相同時鐘頻率下,理論帶寬直接翻倍,為實現高達 22 TB/s 的單堆棧帶寬 奠定基礎。單顆 HBM4 堆棧可提供更大容量,Vera Rubin GPU 配備 288GB HBM4,顯著支持超大規模 AI 模型訓練。
微軟還表示,除了新款芯片Maia200外,還將提供一套軟件工具包,供開發者進行程序設計,其中包括Triton開放原始碼軟件,由聊天機器人ChatGPT開發者OpenAI大力貢獻,能執行與英偉達軟件Cuda相同的任務。
-
微軟
+關注
關注
4文章
6741瀏覽量
107844 -
3nm
+關注
關注
3文章
237瀏覽量
15028
發布評論請先 登錄
曦望發布新一代推理GPU芯片,單位Token推理成本降低90%
微軟發布AI芯片Maia 200,性能超越谷歌TPU和亞馬遜Trainium
今日看點:微軟發布新定制 AI 芯片 Maia 200;國芯科技累計出貨2500萬顆創新高
亞馬遜發布新一代AI芯片Trainium3,性能提升4倍
云巨頭算力戰升級!微軟新一代3nm AI推理芯片性能提升30%,落地數據中心
評論