電子發燒友網報道(文/周凱揚)相信對超算市場有過一定了解的朋友,都對曾經的第一名富岳超算不陌生。這臺2021年正式啟用的超算,是全球首臺登頂TOP500的Arm架構超算。富岳采用了富士通設計A64FX SoC,整個超算集群的峰值性能可以達到537.21PFlop/s。如此強大的性能,甚至于日本東京工業大學、日本東北大學等都宣布將借助富岳來開發日語生成式AI。
然而在最新的TOP500排行榜上,隨著更新的英特爾Xeon和AMD EPYC處理器紛紛到位,如今的富岳已經降至第四名的位置。為此,富士通也在開發A64FX的繼任者,并計劃用于下一代超算的開發中去。
Monaka,A64FX的繼任者
作為一直在超算領域發力的頭部廠商之一,富士通此前一直選擇SPARC作為其計算處理器的架構,直到A64FX的出現。A64FX面世之時一度被稱為最強Arm處理器,也讓不少人對Arm在數據中心和HPC的前景有了新的改觀。
然而這種眾核處理器,除非經過特殊的架構優化,否則并不適合用于通用服務器,國產的申威26010服務器也是類似的設計思路。但不可否認在HPC應用下,眾核處理器可以發揮出媲美甚至超越傳統x86旗艦處理器的實力。
近日,富士通宣布了他們在研的下一代眾核Arm處理器Monaka,該處理器除了改用Armv9架構,引入了SVE2之外,還采用了云原生的3D眾核設計,專為數據中心做了能效優化。Monaka采用了3D Chiplet的設計方案,其中處理器核心die基于2nm工藝打造,而SRAM和IO die基于5nm工藝打造,通過TSV與核心die相連。
然而在最新的TOP500排行榜上,隨著更新的英特爾Xeon和AMD EPYC處理器紛紛到位,如今的富岳已經降至第四名的位置。為此,富士通也在開發A64FX的繼任者,并計劃用于下一代超算的開發中去。
Monaka,A64FX的繼任者
作為一直在超算領域發力的頭部廠商之一,富士通此前一直選擇SPARC作為其計算處理器的架構,直到A64FX的出現。A64FX面世之時一度被稱為最強Arm處理器,也讓不少人對Arm在數據中心和HPC的前景有了新的改觀。
然而這種眾核處理器,除非經過特殊的架構優化,否則并不適合用于通用服務器,國產的申威26010服務器也是類似的設計思路。但不可否認在HPC應用下,眾核處理器可以發揮出媲美甚至超越傳統x86旗艦處理器的實力。
近日,富士通宣布了他們在研的下一代眾核Arm處理器Monaka,該處理器除了改用Armv9架構,引入了SVE2之外,還采用了云原生的3D眾核設計,專為數據中心做了能效優化。Monaka采用了3D Chiplet的設計方案,其中處理器核心die基于2nm工藝打造,而SRAM和IO die基于5nm工藝打造,通過TSV與核心die相連。

Monaka 3D眾核架構 / 富士通
據富士通透露,2nm的核心die區域僅僅占了整個芯片面積的不到30%,從而帶來極高的能效表現,只需用到風冷。同時3D眾核架構使其可以塞入雙插槽144個核心,實現極低的延遲和更高的帶寬。
至于在軟件支持上,富士通除了持續開發Linux OS中行業標準軟件的支持外,也會參與發展與Arm相關的開源軟件生態,加強在Python、Java、LLVM等標準工具上的性能表現。Monaka預計將于2027年正式亮相,考慮到其流片時間,富士通既有可能選擇臺積電、英特爾等現有的先進晶圓代工廠,也可能考慮正在建設2nm工廠的Rapidus。
HPC轉向AI主導?
作為目前最有利可圖的市場,AI正在驅動GPGPU聚焦在低精度計算的算力升級上。在CUDA平臺的助力下,HPC生態的門檻也在持續降低。從這幾年發布的新品來看,無論是FP16、FP8的算力都在成倍增長,然而在FP64這種傳統HPC應用需要用到的高精度數據格式上,性能提升卻相當有限。
更重要的是,要想通過堆量來提高HPC集群的FP64性能也不再現實了,因為GPU的TDP提升幅度甚至更高。為此,富士通的看法是,將更多的FP64單元放在CPU端,而將更多的HBM和低精度矩陣單元放在GPU端,這樣構建HPC系統的客戶就不再需要為GPU的巨額成本和巨量功耗買單,卻可以利用其在深度學習上的卓越性能。同時,開發更多HPL-MxP應用,利用混合精度計算來提高效率。當然了,也可以施壓GPU廠商進一步改善其FP64性能,只不過在生成式AI依舊火熱的當下,讓GPU廠商放棄這個搖錢樹并不現實。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
ARM
+關注
關注
135文章
9553瀏覽量
391898 -
超算
+關注
關注
1文章
118瀏覽量
9532 -
富士通
+關注
關注
2文章
213瀏覽量
55974
發布評論請先 登錄
相關推薦
熱點推薦
Genio 720處理器規格參數_MTK8391高算力核心板方案
Genio 720(MT8391)處理器規格參數,采用先進的6nm制程工藝,兼顧高性能與低功耗,適配無風扇設計及電池供電移動設備需求。CPU架構:八核處理器,包含2顆Arm Corte
新思科技ZeBu助力富士通數據中心創新
全球企業和政府正積極尋求解決方案,應對數據中心能耗迅速增長問題,開發下一代“綠色”數據中心——既具備高性能,又兼具高能效的設施。全球科技巨頭富士通在先進處理器開發領域已領先 60 年,致力于開發更節能、更可持續的數據中心。
富士通FRAM秒寫實時數據
富士通MB85RC04VPNF-G-JNERE1 4Kbit工業級FRAM,150ns極速寫入、1萬億次擦寫、-40℃~+85℃寬溫,I2C接口低功耗,SOP-8小封裝,為PLC、電表、編碼器等邊緣節點提供高可靠非易失存儲。
Andes晶心科技推出AndesCore 46系列處理器家族
Andes晶心科技,作為高效能、低功耗32/64位RISC-V處理器核的領導供貨商及RISC-V國際組織的創始首席會員,今日宣布推出具有4個成員的AndesCore 46系列處理器家族。首款成員AX46MPV是
富士通2025年第一季度營收7498億日元
富士通于7月30日發布了2025財年第一季度財報。根據財報顯示,2025財年第一季度整體營收為7,498億日元,調整后營業利潤351億日元,較上一年度同期增長111.9%,利潤率提升至
Texas Instruments 適用于AM64x Sitalog ?處理器的SK-AM64B入門套件數據手冊
Texas Instruments適用于AM64x Sitara?處理器的SK-AM64B入門套件是一個獨立的測試和開發平臺,是加速設計原型階段的理想選擇。AM64x處理器由一個雙
揭秘瑞芯微算力協處理器,RK3576/RK3588強大算力搭檔
瑞芯微算力協處理器-Gongga1(簡稱“貢嘎”),是瑞芯微針對旗艦芯片平臺RK3576/RK3588等SoC平臺配套的算力處理器。憑借其先進的封裝技術、高性能低功耗、超低延遲響應和多
富士通發布2025年技術與服務愿景
富士通株式會社發布了《Technology and Service Vision 2025(富士通技術與服務愿景2025)》,對商業與社會的未來愿景進行了總結與展望。借助人機智能協作驅動的跨行業
龍芯處理器支持WINDOWS嗎?
龍芯處理器目前不支持原生運行Windows操作系統,主要原因如下:
架構差異
龍芯架構:龍芯早期基于MIPS架構,后續轉向自主研發的LoongArch指令集(與x86/ARM不兼容
發表于 06-05 14:24
紫光展銳4G旗艦性能之王智能穿戴平臺W527登場 一大核三小核異構處理器架構
W527產品亮點: 1、業界領先的一大核三小核異構處理器架構,性能體驗凌駕同類產品; 2、12nm工藝制程,超微高集成3D SiP技術,PC
適用于單核、雙核和四核應用處理器的PMIC DA9063L-A數據手冊
DA9063L-A 是一款功能強大的系統電源管理集成電路(PMIC),適用于單核、雙核和四核應用處理器,例如那些基于 ARM? Cortex
AI MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-AI3 加速器和高性能實時處理器
RZ/V2H 高端 AI MPU 采用瑞薩電子專有的AI 加速器-動態可重配置處理器 (DRP-AI3)、四核 Arm^?^ Cortex ^?^ -A55 (1.8GHz) Linu
帶四核Arm Cortex-A57和四核Arm Cortex-A53 CPU的RZ/G2H超高性能微處理器數據手冊
具有超高處理性能的四核 Arm?Cortex?-A57(1.5GHz)和四核 Arm Cortex-A53(1.2GHz)CPU,具有 3D
采用雙核Arm Cortex-A57 CPU的超高性能微處理器RZ/G2N數據手冊
RZ/G2N憑借雙核 Arm? Cortex?-A57(1.5GHz)處理器,具備更高規格的處理性能,同時擁有 3D 圖形處理能力以及 4K
預定下代超算第一?富士通144核Arm處理器公開
評論