燧原科技于7月7日在上海發布第二代人工智能訓練產品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”,成為國內首家發布第二代人工智能訓練產品組合的公司。
這是繼2019年12年發布第一代訓練芯片,邃思1.0及云燧T10/T11,2020年12月發布第一代推理產品云燧i10之后,燧原科技的又一力作。
?
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發布“云燧T20”訓練加速卡和“邃思2.0”芯片
燧原產品的商業落地場景包括,液冷超大規模集群,加速視頻內容生產;強化學習使能游戲AI,改變數字娛樂的方式;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數據,構建新型智能化交通;高效推理算力集群,建設園區AI視頻云。
隨著第二代產品的發布,將加速這些場景的商業化落地。
云燧智算集群
隨著自然語言處理、強化學習、無監督學習、多模態和認知模型等的發展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應用上,綠色一體化的超級智算集群是關鍵趨勢。
燧原發布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓練卡以及80%的線性度。

這是為智能計算和新基建算力而推出的集群化產品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計算芯片,邃思DTU2.0性能強悍
邃思DTU2.0是中國最大的計算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構成先進封裝。封裝尺寸為57.5mm*57.5mm。
?
DTU2.0的計算能力,單精度FP32達40FLOPS,支持單精度張量TF32,達160T FLOPS。TF32格式被認為是在數據中心最先進的數據模式。
此外,DTU2.0植入完全可編程的數據流,軟件指令驅動的傳輸和數據計算,標量、向量和張量的高效數據處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內存,帶寬達1.8TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內存的產品。

6個LARE卡間互聯端口,每一個端口雙向50GB/s,總集群互聯帶寬300GB/s。
云燧T21\T20訓練產品,分別為OAM標準模組和全高全長PCIE板卡。

以Benchmark數據來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標檢測、圖像分割、推薦等均有明顯優勢。

馭算Topsrider2.0架構
馭算TopsRider是燧原科技自主知識產權的計算及編程平臺,通過軟硬件協同架構設計,充分發揮邃思2.0的性能;基于算子泛化技術及圖優化策略,支持主流深度學習框架下的各類模型訓練;利用Horovod分布式訓練框架與GCU-LARE互聯技術相互配合,為超大規模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優化提供了自定義的開發能力。

云端訓練計算產品路線圖
訓練產品方面,燧原計劃第三代T30/T31產品將于2023年發布,每瓦的能效將提升14倍。同時升級到Matrix3.0。

推理計算方面,2021年下半年將發布i20推理芯片,以及2023年將發布i30。其每瓦能效將分別提升4倍和16倍。

另外,在Topsrider2.x的基礎上,還將進一步升級至Topsrider3.x,致力于泛AI生態。
生態建設
AI生態也是跨行業的、復雜的生態競爭。燧原推出的異構計算生態燎原計劃,將聚集生態的三大特征:原始創新、標準化和生態共建。
燎原計劃將建立繁榮開放的開發者生態,健康互利的產業生態,持續創新的科研生態。打造以人工智能為起點構建通用異構計算生態,構建標準化的技術體系,共建完整生態服務數字中國。將涵蓋深度學習計算,通用異構計算以及視覺計算。

趙立東表示,未來行業的發展趨勢表明,以芯片為核心的算力,是工業4.0兵家必爭之地。工業4.0時代,人工智能是關鍵動力。摩爾定律放緩,異構計算加速,基于小芯片、封裝技術,人工智能落地將改變互聯網重塑傳統行業。算力需示爆炸,算力成為人工智能技術發展的基礎。燧原科技要建立世界水平的本土化研發和工程化團隊,開發國產自主創新的核心技術,布局云端AI+高端芯片雙賽道。我們為數據中心打造最優的云端AI產品,形成訓練推理完整的閉環解決方案。
本文由電子發燒友原創,作者黃晶晶,微信號kittyhjj,轉載請注明以上來源。如需入群交流,請添加微信elecfans999,投稿發郵件到huangjingjing@elecfans.com。
這是繼2019年12年發布第一代訓練芯片,邃思1.0及云燧T10/T11,2020年12月發布第一代推理產品云燧i10之后,燧原科技的又一力作。
?燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發布“云燧T20”訓練加速卡和“邃思2.0”芯片
燧原產品的商業落地場景包括,液冷超大規模集群,加速視頻內容生產;強化學習使能游戲AI,改變數字娛樂的方式;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數據,構建新型智能化交通;高效推理算力集群,建設園區AI視頻云。
隨著第二代產品的發布,將加速這些場景的商業化落地。
云燧智算集群
隨著自然語言處理、強化學習、無監督學習、多模態和認知模型等的發展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應用上,綠色一體化的超級智算集群是關鍵趨勢。
燧原發布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓練卡以及80%的線性度。

這是為智能計算和新基建算力而推出的集群化產品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計算芯片,邃思DTU2.0性能強悍
邃思DTU2.0是中國最大的計算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構成先進封裝。封裝尺寸為57.5mm*57.5mm。
?
燧原科技第二代通用人工智能訓練芯片“邃思2.0”
DTU2.0的計算能力,單精度FP32達40FLOPS,支持單精度張量TF32,達160T FLOPS。TF32格式被認為是在數據中心最先進的數據模式。
此外,DTU2.0植入完全可編程的數據流,軟件指令驅動的傳輸和數據計算,標量、向量和張量的高效數據處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內存,帶寬達1.8TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內存的產品。

6個LARE卡間互聯端口,每一個端口雙向50GB/s,總集群互聯帶寬300GB/s。
云燧T21\T20訓練產品,分別為OAM標準模組和全高全長PCIE板卡。

以Benchmark數據來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標檢測、圖像分割、推薦等均有明顯優勢。

馭算Topsrider2.0架構
馭算TopsRider是燧原科技自主知識產權的計算及編程平臺,通過軟硬件協同架構設計,充分發揮邃思2.0的性能;基于算子泛化技術及圖優化策略,支持主流深度學習框架下的各類模型訓練;利用Horovod分布式訓練框架與GCU-LARE互聯技術相互配合,為超大規模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優化提供了自定義的開發能力。

云端訓練計算產品路線圖
訓練產品方面,燧原計劃第三代T30/T31產品將于2023年發布,每瓦的能效將提升14倍。同時升級到Matrix3.0。

推理計算方面,2021年下半年將發布i20推理芯片,以及2023年將發布i30。其每瓦能效將分別提升4倍和16倍。

另外,在Topsrider2.x的基礎上,還將進一步升級至Topsrider3.x,致力于泛AI生態。
生態建設
AI生態也是跨行業的、復雜的生態競爭。燧原推出的異構計算生態燎原計劃,將聚集生態的三大特征:原始創新、標準化和生態共建。
燎原計劃將建立繁榮開放的開發者生態,健康互利的產業生態,持續創新的科研生態。打造以人工智能為起點構建通用異構計算生態,構建標準化的技術體系,共建完整生態服務數字中國。將涵蓋深度學習計算,通用異構計算以及視覺計算。

趙立東表示,未來行業的發展趨勢表明,以芯片為核心的算力,是工業4.0兵家必爭之地。工業4.0時代,人工智能是關鍵動力。摩爾定律放緩,異構計算加速,基于小芯片、封裝技術,人工智能落地將改變互聯網重塑傳統行業。算力需示爆炸,算力成為人工智能技術發展的基礎。燧原科技要建立世界水平的本土化研發和工程化團隊,開發國產自主創新的核心技術,布局云端AI+高端芯片雙賽道。我們為數據中心打造最優的云端AI產品,形成訓練推理完整的閉環解決方案。
本文由電子發燒友原創,作者黃晶晶,微信號kittyhjj,轉載請注明以上來源。如需入群交流,請添加微信elecfans999,投稿發郵件到huangjingjing@elecfans.com。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
91文章
39776瀏覽量
301372 -
燧原科技
+關注
關注
0文章
152瀏覽量
10414
發布評論請先 登錄
相關推薦
熱點推薦
押注千億智能家電市場,海思嵌入式AI芯片有何大招?
在白色家電的控制領域,扮演核心角色,負責傳感器數據處理、電機控制和邏輯判斷的傳統MCU計算力有限,無法支持復雜的AI算法。上海海思針對這一痛點,推出了內置eAI引擎的嵌入式AI
國產AI芯片真能扛住“算力內卷”?海思昇騰的這波操作藏了多少細節?
最近行業都在說“算力是AI的命門”,但國產芯片真的能接住這波需求嗎?
前陣子接觸到海思昇騰910B,實測下來有點超出預期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
發表于 10-27 13:12
全球首款“可逆計算”冰河芯片誕生,相比普通芯片節能30%
近日,國內芯片研發團隊正式宣布全球首款基于可逆計算架構的 “冰河芯片” 成功誕生,經第三方權威機構測試,該芯片相比同性能傳統
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
、分布式群體智能
1)物聯網AGI系統
優勢:
組成部分:
2)分布式AI訓練
7、發展重點:基于強化學習的后訓練與推理
8、超越大模型:神經符號計算
三、AGI
發表于 09-18 15:31
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經形態計算、類腦芯片
AI芯片不僅包括深度學細AI加速器,還有另外一個主要列別:類腦芯片。類腦芯片是模擬人腦神經網絡架構的芯片
發表于 09-17 16:43
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
持續發展體現在:
1、收益遞減
大模型的基礎的需要極大的算力,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環境相關的資源。
收益遞減體現在:
①模型大小
②訓練數據量
③訓練
發表于 09-14 14:04
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創新方法與架構
算法
5.2加速矩陣乘法的芯片架構
①新的矩陣乘法器架構
②基于RISC-V的矩陣乘法擴展指令集
③用信息論的思想來減少AI推理計算量
三、用于邊緣側訓練或推理的
發表于 09-12 17:30
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰
②Transformer引擎③NVLink Switch系統④機密計算⑤HBM
FPGA:
架構的主要特點:可重構邏輯和路由,可以快速實現各種不同形式的神經網絡加速。
ASIC:
介紹了幾種ASIC AI芯片
發表于 09-12 16:07
AI 芯片浪潮下,職場晉升新契機?
、新架構不斷涌現。能夠在工作中提出創新性的解決方案,推動 AI 芯片性能、功耗、成本等關鍵指標的優化,將極大提升在職稱評審中的競爭力。例如,在芯片設計中引入新的計算范式,如存算一體技術
發表于 08-19 08:58
今日看點丨兩家國產頭部廠商發布新一代AI芯片 ;臺積電在美先進封裝布局啟動
? ? H20重返中國在即,兩家國產頭部廠商發布新一代AI芯片 ? 日前,燧原科技和沐曦這兩家頭部國產A
發表于 07-28 10:41
?2473次閱讀
AI芯片:加速人工智能計算的專用硬件引擎
人工智能(AI)的快速發展離不開高性能計算硬件的支持,而傳統CPU由于架構限制,難以高效處理AI任務中的大規模并行計算需求。因此,專為AI優
全球首個AI設計芯片系統誕生,來自中科院
電子發燒友網綜合報道,近日,中國科學院計算技術研究所處理器芯片全國重點實驗室聯合軟件研究所,推出全球首個基于人工智能技術的處理器芯片軟硬件全自動設計系統 ——“啟蒙”。 ? 該系統實現
海思SD3403邊緣計算AI數據訓練概述
AI數據訓練:基于用戶特定應用場景,用戶采集照片或視頻,通過AI數據訓練工程師**(用戶公司****員工)** ,進行特征標定后,將標定好的訓練
發表于 04-28 11:11
中國最大的計算芯片誕生!燧原科技發布邃思2.0 AI訓練芯片
評論