從去年11月公布的最新TOP500超算系統(tǒng)排名上,我們可以看出AMD已經(jīng)開始蠶食原本屬于英特爾的份額,而且速度不容小覷。而英偉達則因為在GPU上的頭號交椅地位,成了堅持所有堅持CPU+GPU架構(gòu)超算的首選。
非但如此,英偉達開始在ARM生態(tài)上有所動作,推出了Grace這樣的高性能CPU,并被瑞士超算中心的超級計算機系統(tǒng)阿爾卑斯所用。然而近來的一系列動向表明,超算市場并不會就此維持定局。
英特爾:GPU和異構(gòu)開始猛追
英特爾耕耘了這么多年HPC和超算市場,自然不會白白認輸,尤其是自己的圖形部門正在崛起的情況下。于是,就在上周的投資者大會上,英特爾公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一個Xeon插槽的設(shè)計,由此推出全新的XPU,代號名為FalconShores。
FalconShores將融合通用x86處理器核心和高度并行計算的Xe-HPC GPU核心,并結(jié)合英特爾自研的高帶寬共享內(nèi)存。根據(jù)英特爾的說法,這種CPU+GPU+通用內(nèi)存的架構(gòu)可以將單個插槽的計算密度提升5倍,與現(xiàn)有的設(shè)計相比,可將性能功耗比提升5倍以上。
非但如此,英偉達開始在ARM生態(tài)上有所動作,推出了Grace這樣的高性能CPU,并被瑞士超算中心的超級計算機系統(tǒng)阿爾卑斯所用。然而近來的一系列動向表明,超算市場并不會就此維持定局。
英特爾:GPU和異構(gòu)開始猛追
英特爾耕耘了這么多年HPC和超算市場,自然不會白白認輸,尤其是自己的圖形部門正在崛起的情況下。于是,就在上周的投資者大會上,英特爾公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一個Xeon插槽的設(shè)計,由此推出全新的XPU,代號名為FalconShores。
FalconShores將融合通用x86處理器核心和高度并行計算的Xe-HPC GPU核心,并結(jié)合英特爾自研的高帶寬共享內(nèi)存。根據(jù)英特爾的說法,這種CPU+GPU+通用內(nèi)存的架構(gòu)可以將單個插槽的計算密度提升5倍,與現(xiàn)有的設(shè)計相比,可將性能功耗比提升5倍以上。

FalconShoresXPU / 英特爾
這對于英特爾目前的戰(zhàn)略來說,基本上可以說是必選的一條技術(shù)路線。考慮到英特爾在先進封裝技術(shù)上并未止步,工藝節(jié)點也開始跟上主流代工廠的節(jié)奏,異構(gòu)計算的設(shè)計已經(jīng)在英特爾近期推出的諸多產(chǎn)品中得到了驗證,通用內(nèi)存也已經(jīng)在業(yè)界成了改善延遲提高帶寬的常用手段之一。況且英特爾已經(jīng)在其Sapphire Rapids Xeon服務器處理器上用到了HBM2e這類高帶寬內(nèi)存,F(xiàn)alconShores中自研的高帶寬內(nèi)存會有何等性能確實令人好奇。
FalconShores的另一大優(yōu)勢在與靈活的核心配比,根據(jù)工作負載來調(diào)整x86核心與Xe核心。英特爾在會上不斷給出十萬億億級的概念,這樣的性能在FalconShores的性能下似乎是可行的,不過這一XPU正式進入超算市場的時間不會太快,而是要等到2024年,借助那時的埃米級工藝和Foveros封裝技術(shù)才能實現(xiàn)。
英偉達:不放棄ARM,也不放棄互聯(lián)
前陣子英偉達收購ARM失敗的消息傳來,不少人認為英偉達會就此放棄這塊蛋糕,然而英偉達CEO黃仁勛卻表示他們并不會就此放棄ARM生態(tài),未來將繼續(xù)推出Grace這樣基于ARM架構(gòu)的CPU。之所以能有如此的底氣,在于英偉達那20年的ARM架構(gòu)授權(quán)。
目前擁有ARM架構(gòu)授權(quán)的企業(yè)屈指可數(shù),更不用說64位的授權(quán),并將其用于HPC市場了。英偉達如今這種ARM CPU+GPU的路線,看似是在搶英特爾和AMD的生意,但面向的市場其實又有所不同。

GraceCPU /英偉達
Grace雖然性能不差,但與這些x86 CPU在通用計算上相比還是略遜一籌,況且也不是所有研究機構(gòu)或超算中心都會像日本一樣,構(gòu)建富岳或紫藤花這種規(guī)模的ARM超算。英偉達追求的并不是在通用計算上超過其他兩家數(shù)十年的積累,而是專注于AI算力。訓練自然語言處理模型、利用GPU加速深度學習,這才是英偉達的優(yōu)勢所在。
這時問題來了,為何超算不選擇其它通用CPU或其它的GPU產(chǎn)品呢?這樣既能兼顧通用計算性能,也能用的GPU的加速性能。這是因為英偉達準備了專用于自家CPU和GPU的互聯(lián)技術(shù)NVLink。過去僅有GPU產(chǎn)品的英偉達僅僅將NVLink技術(shù)用于GPU之間的互聯(lián),如今在Grace出現(xiàn)后,NVLink4.0可以為GraceCPU和英偉達GPU牽線搭橋。
更不用說英偉達已經(jīng)在2020年收購了Mellanox,要知道在最新的TOP500超算中,除了使用常規(guī)的25/100G以太網(wǎng)互聯(lián)外,基本都用到了Mellanox的互聯(lián)技術(shù)。英偉達與Mellanox的結(jié)合,直接覆蓋了三分之二的頂級超算系統(tǒng)。未來的NVLink有了Mellanox的幫忙更是難以匹敵,所以并不是英偉達擔心競品的出現(xiàn),而是其性能表現(xiàn)之強,讓你不得不選擇他們旗下的產(chǎn)品。
小結(jié)
英特爾在超算上的發(fā)力歸根結(jié)底還是靠XeHPC這樣的GPU核心,但作為GPU新秀的英特爾短時間還是無法撼動英偉達在超算上的地位。而英偉達的ARM計劃未來如何演進也令人十分期待,畢竟這一產(chǎn)品線不像其消費級GPU,還未有任何路線圖公布。但喜人的一點是,超算從百億億級過渡到十萬億億級的過程中,勢必會有更多的創(chuàng)新方案出現(xiàn)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
cpu
+關(guān)注
關(guān)注
68文章
11279瀏覽量
224982 -
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135447 -
超算
+關(guān)注
關(guān)注
1文章
118瀏覽量
9532
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
GPU 利用率<30%?這款開源智算云平臺讓算力不浪費 1%
作為 AI 開發(fā)者,你是否早已受夠這些困境:花數(shù)百萬采購的 GPU 集群,利用率常年低于 30%,算力閑置如同燒錢;跨 CPU/GPU/NPU 異構(gòu)資源調(diào)度難如登天,模型訓練卡在資源分
AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?
CPU作為“通用基石”,支撐所有設(shè)備的基礎(chǔ)運行;GPU憑借并行算力,成為AI訓練與圖形處理的“主力”;TPU在Google生態(tài)中深耕云端大模型訓練;NPU則讓AI從“云端”走向“身邊”(手機、手表
別只把RJ45直通頭當“網(wǎng)線連接器”!這些隱藏場景和玩法太實用
作為電子發(fā)燒友,我們總熱衷于折騰各類電子設(shè)備,從家庭組網(wǎng)到設(shè)備改造,每一個小配件都能玩出不一樣的花樣。而RJ45直通頭作為最基礎(chǔ)的網(wǎng)絡(luò)配件,多數(shù)人只解鎖了“對接網(wǎng)線”這一個功能,卻忽略了它在設(shè)備改造、臨時組網(wǎng)中的隱藏玩法,今天就分享其6個實用場景,幫大家解鎖新技能。
UART 串口通信還能玩出什么花樣?
還記得打印機、鼠標和調(diào)制解調(diào)器曾經(jīng)使用粗線和笨重連接器嗎?那些必須擰進電腦里的連接器?這些設(shè)備很可能使用UART與電腦通信。雖然USB幾乎完全取代了那些老式的線纜和連接器,但UART絕非過時之物。你會發(fā)現(xiàn)UART在許多DIY電子項目中被用于將GPS模塊、藍牙模塊和RFID讀卡器模塊連接到你的RaspberryPi、Arduino或其他微控制器。UART是通用
從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)算力計算效能
前言AI算力已成為數(shù)字經(jīng)濟時代的核心生產(chǎn)力,但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計,行業(yè)算力資源平均利用率僅為30%~40%,存在嚴重的算力浪費現(xiàn)象。國內(nèi)領(lǐng)先
如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標
分析GPU核心參數(shù)體系:算力、顯存大小、顯存帶寬、熱門架構(gòu)特性等關(guān)鍵指標,旨在幫您理解不同應用場景下,如何選擇最合適的GPU算力解決方案。1、算
從 CPU 到 GPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計?
渲染技術(shù)是計算機圖形學的核心內(nèi)容之一,它是將三維場景轉(zhuǎn)換為二維圖像的過程。渲染技術(shù)一直在不斷演進,從最初的CPU渲染到后來的GPU渲染,性能和質(zhì)量都有了顯著提升。從CPU到GPU:技術(shù)
科技賦能汽車制造玩出新花樣
汽車行業(yè)正處于數(shù)字化復興時期。汽車制造的線性、勞動密集型流程已幾乎一去不復返。如今,汽車制造已成為機器人技術(shù)、人工智能和數(shù)據(jù)驅(qū)動的協(xié)同工作,機器不僅能夠制造,還能思考、適應和不斷優(yōu)化。
移遠Zigbee+BLE 多協(xié)議模組來了!讓智能連接玩出新花樣
7月17日,全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應商移遠通信宣布,正式發(fā)布其全新高性能MCUZigbee+BLE模組KCMA32S。該模組以多協(xié)議融合技術(shù)為核心,集高性能、小尺寸、高安全性于一體,憑借先進的連接技術(shù)和緊湊的外形設(shè)計,將有力驅(qū)動智能照明、智能樓宇、智能家居等場景的連接技術(shù)迭代升級。硬核配置加持,夯實性能與安全底座KCMA32S搭載SiliconLab
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應用到原理
前言
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了芯片架構(gòu)的基礎(chǔ)知識,但該部分知識比較晦澀難懂,或許是由于我一直從事的事芯片
發(fā)表于 06-18 19:31
軟通智算完成超億級A輪融資,加速AI算力產(chǎn)業(yè)布局
北京 2025年6月18日 /美通社/ -- 近日,軟通動力旗下軟通智算科技(廣東)集團有限公司(以下簡稱"軟通智算")完成超億級A輪融資,本輪融資由盛景嘉成創(chuàng)投領(lǐng)投,廣發(fā)信德、毅達資本等多家知名
車牌識別新花樣:樹莓派打造智能車牌監(jiān)控系統(tǒng)!
樹莓派是創(chuàng)客們打造家庭安防系統(tǒng)的熱門之選,這得益于其具備運用人工智能(AI)的能力。AI系統(tǒng)能識別潛在威脅,在此情境下,還能識別過往車輛的牌照信息。創(chuàng)客YashIndane就開發(fā)了一款這樣的車牌識別
搭建算力中心,從了解的GPU 特性開始
ABSTRACT摘要本文介紹如何搭建算力,并介紹A100、H100、H200和B200這些GPU的特性。JAEALOT2025年4月23日隨著人工智能、大數(shù)據(jù)和高性能計算(HPC)的快速發(fā)展,市場上
超算硝煙再起,CPU+GPU還能玩出新花樣?
評論