在Arm服務(wù)器處理器陣營中,鮮少有從開始一直挺立到現(xiàn)在的,Marvell算其中一個。
現(xiàn)在仍然可以查到Marvell發(fā)表于2010年的媒體簡報(bào),“Marvell今天發(fā)布新款A(yù)RM架構(gòu)嵌入式處理器ARMADA XP,將主要用于云計(jì)算等企業(yè)應(yīng)用領(lǐng)域,諸如高性能網(wǎng)絡(luò)設(shè)備、網(wǎng)頁服務(wù)器,以及家用NAS、媒體服務(wù)器等。運(yùn)算內(nèi)核包括四核心,頻率最高1.6GHz,擁有2MB二級緩存,其運(yùn)算性能可達(dá)16600DMIPS,而功耗低于10W。”
今天看來,當(dāng)時的配置和愿景都過于樸素。
時間就這樣過去了十年。
這期間,Marvell對旗下業(yè)務(wù)大刀闊斧地進(jìn)行了整并,移動芯片和多媒體芯片業(yè)務(wù)對外出售,基礎(chǔ)設(shè)施領(lǐng)域?qū)嵙Σ粩鄰?qiáng)化,直到現(xiàn)在成為一家專注于基礎(chǔ)設(shè)施市場的半導(dǎo)體廠商,提供存儲、處理、網(wǎng)絡(luò)、無線連接和安全產(chǎn)品組合,服務(wù)器芯片地位越來越重。
今天,Marvell的服務(wù)器芯片主要聚焦三大應(yīng)用市場:超算、云端、邊緣,保持著兩年一代的上新節(jié)奏。
?
一次咄咄逼人的上新
近日,Marvell基于第三代Arm的服務(wù)器處理器ThunderX3取得突破性進(jìn)展。它專為當(dāng)今云計(jì)算和HPC市場上較嚴(yán)苛的工作負(fù)載而設(shè)計(jì),可提供高性能、低功耗、高內(nèi)存帶寬和低內(nèi)存延遲,將于今年年中向客戶提供樣片。Marvell半導(dǎo)體公司副總裁及服務(wù)器處理器部總經(jīng)理Gopal Hegde指出,如今數(shù)據(jù)中心已從對單線程性能的關(guān)注轉(zhuǎn)向?qū)C(jī)架級別性能的關(guān)注,其中性能功耗比、性能成本比和TCO(總擁有成本)是部署考慮的三大關(guān)鍵因素。因此,數(shù)據(jù)中心開始采用專為特定工作負(fù)載而定制的服務(wù)器。
相比上一代ThunderX2,ThunderX3實(shí)現(xiàn)了性能上的全面提升。據(jù)介紹,ThunderX3處理器采用臺積電7P制程工藝制造,擁有高達(dá)96個核,4線程/核心,每個插槽的總計(jì)算能力達(dá)到384線程。內(nèi)存接口支持8通道DDR4-3200,每個通道可搭載2個DIMM。I/O擴(kuò)展提供了64個PCIe Gen 4.0通道,搭載16個控制器。該處理器支持單節(jié)點(diǎn)和雙節(jié)點(diǎn)配置。在浮點(diǎn)運(yùn)算方面,ThunderX3的每個核心搭載四個128位SIMD (Neon)單元。該設(shè)備完全符合SBSA/SBBR,并提供了企業(yè)級的RAS和虛擬化功能。
?ThunderX3的性能改進(jìn)如何實(shí)現(xiàn)?Marvell半導(dǎo)體公司服務(wù)器處理器部產(chǎn)品營銷高級總監(jiān)周立新告訴<電子發(fā)燒友>,主要來自于微架構(gòu)的改進(jìn),使得IPC的整體性能較ThunderX2提高25%。結(jié)合處理器頻率和DDR頻率的提升,單線程總體性能較上一代提高了60%以上。在單顆處理器層面,相較于ThunderX2,ThunderX3的整數(shù)運(yùn)算性能提升3倍以上,浮點(diǎn)運(yùn)算性能提升5倍以上。
那么,對于HPC市場來說,需要什么樣的性能?周立新表示,HPC需要很多并行處理,ThunderX3每一個核有4個線程,最多96個核,可以支持384個線程。他強(qiáng)調(diào),單核支持四線程,不論是x86架構(gòu)還是其它Arm處理器,目前都沒有實(shí)現(xiàn),ThunderX3在這方面實(shí)現(xiàn)了“數(shù)量級的差異”。
四線程跟單線程比,究竟有什么好處?可以主要從三方面來看,一是SPECCPU,這是最標(biāo)準(zhǔn)的衡量服務(wù)器的指標(biāo);二是MySQL數(shù)據(jù)庫;三是Web搜索。根據(jù)測算,四線程比單線程有顯著的性能提升,特別是MySQL,可以提高80%的性能。

當(dāng)然,CPU不僅僅是計(jì)算指標(biāo),還涉及先進(jìn)的DDR、PCIe。ThunderX3采用了PCIe 4.0,當(dāng)年在ThunderX2,每個核里面有2個128bit SIMD (Neon) Units,而ThunderX3提升到4個,這對超算、AI和機(jī)器學(xué)習(xí)來說非常重要。
談及對比于x86架構(gòu)處理器的主要優(yōu)勢,Gopal Hegde表示,x86架構(gòu)面向服務(wù)器、桌面等眾多市場,而Armv8-A是專門面向服務(wù)器應(yīng)用開發(fā)的核,在面積、性能、功耗層面更加優(yōu)化。x86架構(gòu)兩大廠商:英特爾在工藝上相比臺積電已落后一兩代,這對其x86服務(wù)器CPU性能有一定的影響;AMD在架構(gòu)上采用封裝集成,64核有9個Die,相應(yīng)地在延時、帶寬方面存在不足,同時功耗偏高。
未來可能考慮Chiplet
各家由于情況不同,也有各自的實(shí)現(xiàn)路徑。比如AMD,其EYPC系列的成功與Chiplet技術(shù)的采用密不可分,它作為一種解決物理瓶頸的方法,Marvell是否會予以考慮?Gopal Hegde談到,當(dāng)時AMD的EPYC,如果把32核放在同一芯片中,物理上首先難以量產(chǎn),就算生產(chǎn)出良率會比較差,所以不得不用4個Die來做32核。Marvell每個核的尺寸比AMD的約小30%左右,所以在ThunderX3中還可以集成這么多核。他談到了一些不采用chiplet的優(yōu)勢,比如內(nèi)存帶寬,而且延遲也比較短。不過,未來再往下走,就算核再小早晚也會碰到物理瓶頸,那時可能也會考慮Chiplet方案。
盤點(diǎn)Arm服務(wù)器陣營的底氣
從Arm進(jìn)入服務(wù)器市場的第一天起,整個業(yè)界就充滿了懷疑的論調(diào),這種唱衰一路貫穿,甚至在高通正式取消其服務(wù)器芯片項(xiàng)目時達(dá)到頂峰。不過,后面的故事越來越精彩,2017年,英特爾前高管離職創(chuàng)辦了從事Arm 服務(wù)器芯片研發(fā)的Ampere公司;2018年,富士通公開介紹了業(yè)界首款支持基于ArmV8指令集擴(kuò)展SVE(Scalable Vector Extension)的A64FX芯片,據(jù)稱性能強(qiáng)悍到無需與GPU組合;2019年AWS推出的Graviton 2堪稱驚艷……
事實(shí)上,也正是從去年開始,業(yè)界推出Arm服務(wù)器處理器的節(jié)奏明顯加快,性能PK也更為激烈。國產(chǎn)陣營的代表有飛騰和華為,作為國內(nèi)最早獲得ARMv8指令集架構(gòu)授權(quán)的設(shè)計(jì)廠商,飛騰的CPU產(chǎn)品近年來不論是性能還是生態(tài)都成果頗豐;還有華為鯤鵬,正在通過全生態(tài)體系和產(chǎn)業(yè)鏈的整合能力高歌猛進(jìn)。
為什么Arm服務(wù)器生態(tài)開始呈現(xiàn)出前所未有的繁榮景象?Gopal Hegde認(rèn)為,最顯著的原因是最終用戶發(fā)現(xiàn)Arm加速應(yīng)用的時機(jī)已經(jīng)成熟,才會有越來越多的人投入。
Arm框架的核心優(yōu)勢在于低能耗、移動市場的高占比。但是,服務(wù)器是一個跟生態(tài)密切相關(guān)的業(yè)務(wù),現(xiàn)在整個市場x86架構(gòu)還是占據(jù)了90%以上的份額。本文發(fā)布之時,英特爾剛剛公布了2020年第一季度財(cái)報(bào),其中數(shù)據(jù)中心業(yè)務(wù)同比增長43%,個中原因這里不去深究,但足以見得Marvell等面臨的是怎樣的對手。
那么,Marvell競爭的底氣來自哪里?
Gopal Hegde表示,生態(tài)層面其實(shí)是一種“滾雪球”效應(yīng),滾到一定地步就會自己越滾越大。自前兩年推出ThunderX2之后,部署進(jìn)度在不斷加速,得到了諸多OEM廠商和平臺、IHV硬件廠商、操作系統(tǒng)和固件、中間件、應(yīng)用和工具的支持,目前生態(tài)系統(tǒng)覆蓋已超過100家合作伙伴企業(yè)。微軟正為Azure部署基于ThunderX2的量產(chǎn)級服務(wù)器,也公開表態(tài)未來可能有40%-50%的量遷移到Arm平臺上。此外,ThunderX2系列服務(wù)器處理器已實(shí)現(xiàn)對NVIDIA GPU的支持,將進(jìn)一步滿足HPC 和游戲應(yīng)用的需求。
比較聰明的一點(diǎn)是,正如Gopal Hegde在采訪中所澄清的,Marvell并非全線與x86競爭,只主抓生態(tài)成熟、且成長非常快的領(lǐng)域,就是超算和云這兩塊,企業(yè)級的市場不會進(jìn)入。
Arm架構(gòu)在服務(wù)器市場進(jìn)入了關(guān)鍵時期。諸多創(chuàng)新場景帶來的海量數(shù)據(jù)計(jì)算、存儲需求將孕育龐大的云服務(wù)市場,對基礎(chǔ)計(jì)算架構(gòu)產(chǎn)生了真正的多元化的需求。而先進(jìn)算力的提升也確實(shí)需要多元化的構(gòu)建,眼下這種繁榮的生態(tài)景象正是行業(yè)所需要的。
本文由電子發(fā)燒友網(wǎng)原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。如需轉(zhuǎn)載,請?zhí)砑游?a target="_blank">信號elecfans999.
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
ARM
+關(guān)注
關(guān)注
135文章
9553瀏覽量
391885 -
服務(wù)器
+關(guān)注
關(guān)注
14文章
10253瀏覽量
91487 -
X86
+關(guān)注
關(guān)注
5文章
300瀏覽量
45433 -
高性能計(jì)算
+關(guān)注
關(guān)注
0文章
96瀏覽量
13810 -
超算
+關(guān)注
關(guān)注
1文章
118瀏覽量
9532
發(fā)布評論請先 登錄
相關(guān)推薦
熱點(diǎn)推薦
全球首創(chuàng)!RISC-V+AI架構(gòu)高性能服務(wù)器CPU成功點(diǎn)亮
電子發(fā)燒友網(wǎng)報(bào)道 長久以來,全球高端服務(wù)器CPU市場一直被x86和ARM架構(gòu)所主導(dǎo),我國在核心算力領(lǐng)域長期受制于人,高端芯片供應(yīng)鏈安全面臨重大挑戰(zhàn)。 ? 近日,藍(lán)芯算力(深圳)科技有限
英特爾服務(wù)器CPU市場失守:從99.9%到50%以下
電子發(fā)燒友網(wǎng)綜合報(bào)道,近日,市場調(diào)研機(jī)構(gòu) IDC 更新了全球服務(wù)器市場的最新情況。該機(jī)構(gòu)預(yù)計(jì),2025 年全球 x86 服務(wù)器的市場價值將同比增長 39.9%,達(dá)到 2839 億美元;非 x8
KaihongOS桌面版成功適配x86設(shè)備,邀您搶先體驗(yàn)!
2025年6月30日,KaihongOS桌面版已成功適配x86設(shè)備,首次開啟開發(fā)者Beta體驗(yàn)!我們誠邀您參與本次體驗(yàn)計(jì)劃,共同探索國產(chǎn)操作系統(tǒng)的創(chuàng)新與潛力。您的反饋將幫助我們優(yōu)化系統(tǒng),打造更穩(wěn)
打破X86/ARM壟斷!國產(chǎn)全新自主架構(gòu)CPU處理器重磅發(fā)布
3C6000系列、工控及移動終端處理器龍芯2K3000/3B6000M,以及相關(guān)整機(jī)和解決方案,標(biāo)志著龍芯在自主芯片領(lǐng)域又邁出了堅(jiān)實(shí)的一步。 ? 龍芯中科董事長胡偉武在發(fā)布會上表示:“我國信息產(chǎn)業(yè)的根本出路在于構(gòu)建獨(dú)立于
聚徽廠家視角——X86 架構(gòu) vs. ARM 架構(gòu):工控一體機(jī)的算力、功耗與成本差異解析
在工業(yè)自動化不斷發(fā)展的當(dāng)下,工控一體機(jī)作為核心設(shè)備,其架構(gòu)選擇至關(guān)重要。X86 架構(gòu)與 ARM 架構(gòu)在工控領(lǐng)域各領(lǐng)風(fēng)騷,它們在算力、功耗與成本上的顯著差異,決定了其適用場景的不同。深入剖析兩者特點(diǎn)
RISC-V架構(gòu)CPU的RAS解決方案
RISC-V架構(gòu)以追趕者的姿態(tài)在多個應(yīng)用領(lǐng)域與X86架構(gòu)和ARM架構(gòu)展開競爭。在服務(wù)器應(yīng)用領(lǐng)域,RISC-V架構(gòu)正在重新定義服務(wù)器芯片領(lǐng)域必
奇瑞瑞虎8L問鼎2025環(huán)塔T1.1組總冠軍
當(dāng)大漠黃沙退去,冠軍光芒劃破天際。近日,2025中國環(huán)塔(國際)拉力賽在新疆圓滿落幕。賽事歷經(jīng)13天殘酷鏖戰(zhàn),約5000多公里、4大營地與10個高強(qiáng)度賽段的正面交鋒,T1、T2等各組別的冠軍塵埃落定。
高端芯片自研,服務(wù)器芯片傳來好消息!
電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)當(dāng)前,自研處理器已經(jīng)跨過了能用的階段,逐漸走向好用,但無論是消費(fèi)級還是服務(wù)器級都面臨著如何在性能上接近國外高端產(chǎn)品,以及生態(tài)上如何更加完善的問題。國內(nèi)廠商對于服務(wù)器
ARM服務(wù)器解決方案
ARM服務(wù)器解決方案已成為異構(gòu)計(jì)算領(lǐng)域的重要技術(shù)路徑,其核心優(yōu)勢與多元化場景適配性正加速產(chǎn)業(yè)滲透。以下為關(guān)鍵要點(diǎn)分析: 一、核心優(yōu)勢與架構(gòu)設(shè)計(jì) 能效比優(yōu)化? ARM架構(gòu)基于RISC指令集,單節(jié)點(diǎn)功耗
服務(wù)器CPU架構(gòu)解析,從x86到ARM:一文吃透其分類及對應(yīng)品牌優(yōu)勢
為什么你的服務(wù)器總在"喘氣"?CPU架構(gòu)才是關(guān)鍵。大家可能都遇到過這樣的情況:公司剛采購的服務(wù)器用了不到半年,跑個數(shù)據(jù)庫就像老牛拉車,加內(nèi)存換硬盤都沒用。這時候老工程師會叼著煙告訴你:"小伙子,問題出在CPU架構(gòu)上!"
SoC集群服務(wù)器 與 ARM架構(gòu)陣列服務(wù)器 關(guān)系
。 核心特征?:芯片級集成、高密度算力、低功耗設(shè)計(jì)。 ARM架構(gòu)陣列服務(wù)器? 基于ARM指令集的處理器集群,通過多節(jié)點(diǎn)協(xié)同工作提升整體性能,
雙倍能效陣列云,重新定義服務(wù)器性價比
力高達(dá)48TOPS*72,滿足高并發(fā)AI訓(xùn)練需求?。 ARM架構(gòu)通過多核并行計(jì)算與動態(tài)電源管理技術(shù),實(shí)現(xiàn)“按需供電”,單位機(jī)架算力密度顯著提升,功耗較傳統(tǒng)x86服務(wù)器降低30%-50%?。 ?先進(jìn)制程與能效優(yōu)化? 采用4nm工藝
與x86正面交鋒,Arm服務(wù)器芯片又掀狂瀾
評論