在 2020 年度的 re:Invent 大會上,亞馬遜云服務(AWS)推出了全新的機器學習定制訓練芯片 Trainium 。通過對 TensorFlow、PyTorch 和 MXNet 提供支持,該公司希望帶來比任何競爭對手都更高的性能表現。此外 Trainium 還可作為一個 EC2 實例,在 AWS 的 SageMaker 機器學習平臺上使用,基于這些定制芯片的新實例將于 2021 上半年推出。
Trainium 具有相當顯著的速度和成本優勢,與標準的 AWS GPU 實例相比,AWS 承諾可帶來 30% 的吞吐量提升、以及降低 45% 的單次引用成本。
此外 AWS 正與英特爾合作啟動基于 Habana Gaudi 的 EC2 機器學習訓練實例。與定于 2021 年推出的版本相比,未來版本有望帶來高達 40% 的性價比提升。
需要指出的是,兩款新產品都是去年 re:Invent 大會上推出的 AWS Inferentia 定制芯片方案的補充,且 Trainium 使用了與 Inferentia 相同的軟件開發套件(SDK)。
據悉,在機器學習基礎架構中,90% 的開銷都用于解決推理成本。盡管 Inferentia 有著成本方面的優勢,但開發團隊也受到了固定 ML 訓練的預算限制。
為了突破訓練范圍和頻度的限制,AWS Trainium 通過以云為中心的 ML 訓練,帶來了最高性能和最低成本。結合兩者,客戶能夠切實擴展 ML 訓練的工作量、同時加速端到端的部署。
責編AJX
-
芯片
+關注
關注
463文章
54010瀏覽量
466057 -
機器學習
+關注
關注
66文章
8553瀏覽量
136948 -
AWS
+關注
關注
0文章
444瀏覽量
26560
發布評論請先 登錄
揭曉英偉達最強芯片!Blackwell Ultra、Rubin芯片亮相,新機器人壓軸
今日看點:微軟發布新定制 AI 芯片 Maia 200;國芯科技累計出貨2500萬顆創新高
NVIDIA在CES 2026發布全新物理AI模型
機器學習和深度學習中需避免的 7 個常見錯誤與局限性
穿孔機頂頭檢測儀 機器視覺深度學習
NVIDIA和AWS擴展全棧合作伙伴關系
亞馬遜發布新一代AI芯片Trainium3,性能提升4倍
【Sipeed MaixCAM Pro開發板試用體驗】 + 04 + 機器學習YOLO體驗
NVIDIA Isaac Lab可用環境與強化學習腳本使用指南
**【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**
Raspberry Pi Pico 2 上實現:實時機器學習(ML)音頻噪音抑制功能
AWS推全新機器學習定制訓練芯片Trainium
評論