寒武紀(jì)思元370芯片是基于7nm制程工藝,思元370是寒武紀(jì)首款采用chiplet(芯粒)技術(shù)的AI芯片,集成了390億個(gè)晶體管,最大算力高達(dá)256TOPS(INT8),是寒武紀(jì)第二代產(chǎn)品思元270算力的2倍。憑借寒武紀(jì)最新智能芯片架構(gòu)MLUarch03,思元370實(shí)測(cè)性能表現(xiàn)更為優(yōu)秀。思元370也是國(guó)內(nèi)第一款公開發(fā)布支持LPDDR5內(nèi)存的云端AI芯片,內(nèi)存帶寬是上一代產(chǎn)品的3倍,訪存能效達(dá)GDDR6的1.5倍。搭載MLU-Link?多芯互聯(lián)技術(shù),在分布式訓(xùn)練或推理任務(wù)中為多顆思元370芯片提供高效協(xié)同能力。全新升級(jí)的寒武紀(jì)基礎(chǔ)軟件平臺(tái),新增推理加速引擎MagicMind,實(shí)現(xiàn)訓(xùn)推一體,大幅提升了開發(fā)部署的效率,降低用戶的學(xué)習(xí)成本、開發(fā)成本和運(yùn)營(yíng)成本。
寒武紀(jì)思元370芯片參數(shù)特性詳解
http://www.3532n.com/d/6566167.html
寒武紀(jì)? AIDC? MLU370?-X8智能加速卡訓(xùn)推一體人工智能加速卡
寒武紀(jì)?? AIDC?? MLU370 ?? -X8采用雙芯思元370配置,為雙槽位250w全尺寸智能加速卡,提供24TFLPOS(FP32)訓(xùn)練算力和256TOPS (INT8)推理算力,同時(shí)提供豐富的FP16、BF16等多種訓(xùn)練精度。基于雙芯思元370打造的MLU370-X8整合了兩倍于標(biāo)準(zhǔn)思元370加速卡的內(nèi)存、編解碼資源,同時(shí)MLU370-X8搭載MLU-Link多芯互聯(lián)技術(shù),每張加速卡可獲得200GB/s的通訊吞吐性能,是PCIe 4.0帶寬的3.1倍,支持單機(jī)八卡部署,可高效執(zhí)行多芯多卡訓(xùn)練和分布式推理任務(wù)。
MLU370-X8智能加速卡是全面升級(jí)的數(shù)據(jù)中心訓(xùn)推一體AI加速卡,基于寒武紀(jì)全新一代思元370芯片,接口為PCIe 4.0 X16,是全高全長(zhǎng)雙寬(FHFL-Dual-Slot)的標(biāo)準(zhǔn)PCIe加速卡,適用于業(yè)內(nèi)最新的CPU平臺(tái),可輕松搭載于最先進(jìn)的人工智能服務(wù)器,快速實(shí)現(xiàn) AI算力的部署。MLU370-X8加速卡功耗為250W,可為計(jì)算機(jī)視覺、自然語言處理、語音等多樣化的人工智能應(yīng)用提供強(qiáng)大算力支持。
MLU370-X8 智能加速卡產(chǎn)品手冊(cè)免費(fèi)下載
*附件:MLU370-X8 智能加速卡產(chǎn)品手冊(cè)免費(fèi)下載.doc
產(chǎn)品規(guī)格
| 板卡型號(hào) | MLU370-X8 |
|---|---|
| 計(jì)算架構(gòu) | Camicon MLUarch03 |
| 制程工藝 | 7nm |
| 計(jì)算精度支持 | FP32、FP16、BF16、INT16、INT8、INT4 |
| 峰值性能 | 256 TOPS (INT8) |
| 128 TOPS (INT16) | |
| 96 TFLOPS (FP16) | |
| 96 TFLOPS (BF16) | |
| 24 TFLOPS (FP32) | |
| 內(nèi)存類型 | LPDDR5 |
| 內(nèi)存容量 | 48GB |
| 內(nèi)存帶寬 | 614.4 GB/s |
| 視頻編解碼 | 最高可支持至8K;264路HEVC全高清視頻解碼;48路HEVC全高清視頻編碼; |
| 圖片編解碼 | 圖片編解碼最高分辨率支持16384x16384;8000 Frames/s 全高清圖片解碼;6000 Frames/s 全高清圖片編碼; |
| 系統(tǒng)接口 | x16 PCIe Gen4 |
| MLU-Link?接口 | 4 ports, 16 Lanes, 50 Gbps |
| MLU-Link?帶寬 | 聚合帶寬200GB/s Bi-direction |
| 形態(tài) | 全高全長(zhǎng)雙槽位 |
| 最大熱功耗 | 250W |
| 散熱設(shè)計(jì) | 被動(dòng) |
在寒武紀(jì)基礎(chǔ)軟件平臺(tái) SDK上實(shí)測(cè),在常見的4個(gè)人工智能模型上,MLU370-X8單卡性能與主流350W RTX GPU相當(dāng);而在多卡加速方面,MLU370-X8借助MLU-Link多芯互聯(lián)技術(shù)和寒武紀(jì)基礎(chǔ)軟件平臺(tái) CNCL通訊庫的優(yōu)化,在8卡環(huán)境下達(dá)到更優(yōu)的并行加速比。
性能對(duì)比

*** 測(cè)試環(huán)境
250W MLU370-X8:NF5468M5/Intel Xeon Gold 5218 CPU @ 2.30GHz/MLU370 SDK 1.2.0
350W GPU: Supermicro AS -4124GS-TNR/Intel Xeon Gold 6130 CPU @ 2.10GHz/Cuda11.2
-
加速卡
+關(guān)注
關(guān)注
1文章
74瀏覽量
11357 -
寒武紀(jì)
+關(guān)注
關(guān)注
13文章
217瀏覽量
75004 -
AI芯片
+關(guān)注
關(guān)注
17文章
2140瀏覽量
36826 -
算力
+關(guān)注
關(guān)注
2文章
1588瀏覽量
16811
發(fā)布評(píng)論請(qǐng)先 登錄
寒武紀(jì)“思元220”推動(dòng)邊緣AI應(yīng)用發(fā)展
MLU220-M.2邊緣端智能加速卡支持相關(guān)資料介紹
寒武紀(jì)科技生態(tài)爆發(fā),產(chǎn)業(yè)伙伴展示寒武紀(jì)芯片應(yīng)用
寒武紀(jì)首款智能云端芯片應(yīng)用Cadence Z1硬件仿真加速平臺(tái)
寒武紀(jì)推出邊緣AI芯片思元220
寒武紀(jì)思元290智能芯片及加速卡、玄思1000智能加速器亮相 全面支持AI訓(xùn)練
寒武紀(jì)思元290芯片發(fā)布,具有三大關(guān)鍵亮點(diǎn)
軟硬兼施 寒武紀(jì)同步推出Neuware訓(xùn)練軟件棧
寒武紀(jì)持續(xù)研發(fā)投入 2020年虧損收窄,營(yíng)收穩(wěn)步上漲
寒武紀(jì)發(fā)布新款A(yù)I訓(xùn)練卡 瑞薩電子推出雙波束有源波束成形器IC
【教程】貝啟RK3568開發(fā)板搭載寒武紀(jì)MLU220加速卡使用說明
寒武紀(jì)的思元(MLU)云端智能加速卡與百川智能完成大模型適配,攜手創(chuàng)新生成式AI
寒武紀(jì)與智象未來聯(lián)手,推動(dòng)視覺大模型的技術(shù)創(chuàng)新與應(yīng)用
寒武紀(jì)思元370芯片參數(shù)特性詳解
寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊(cè)詳解
評(píng)論