在Arm服務器處理器陣營中,鮮少有從開始一直挺立到現在的,Marvell算其中一個。
現在仍然可以查到Marvell發表于2010年的媒體簡報,“Marvell今天發布新款ARM架構嵌入式處理器ARMADA XP,將主要用于云計算等企業應用領域,諸如高性能網絡設備、網頁服務器,以及家用NAS、媒體服務器等。運算內核包括四核心,頻率最高1.6GHz,擁有2MB二級緩存,其運算性能可達16600DMIPS,而功耗低于10W。”
今天看來,當時的配置和愿景都過于樸素。
時間就這樣過去了十年。
這期間,Marvell對旗下業務大刀闊斧地進行了整并,移動芯片和多媒體芯片業務對外出售,基礎設施領域實力不斷強化,直到現在成為一家專注于基礎設施市場的半導體廠商,提供存儲、處理、網絡、無線連接和安全產品組合,服務器芯片地位越來越重。
今天,Marvell的服務器芯片主要聚焦三大應用市場:超算、云端、邊緣,保持著兩年一代的上新節奏。
?
一次咄咄逼人的上新
近日,Marvell基于第三代Arm的服務器處理器ThunderX3取得突破性進展。它專為當今云計算和HPC市場上較嚴苛的工作負載而設計,可提供高性能、低功耗、高內存帶寬和低內存延遲,將于今年年中向客戶提供樣片。Marvell半導體公司副總裁及服務器處理器部總經理Gopal Hegde指出,如今數據中心已從對單線程性能的關注轉向對機架級別性能的關注,其中性能功耗比、性能成本比和TCO(總擁有成本)是部署考慮的三大關鍵因素。因此,數據中心開始采用專為特定工作負載而定制的服務器。
相比上一代ThunderX2,ThunderX3實現了性能上的全面提升。據介紹,ThunderX3處理器采用臺積電7P制程工藝制造,擁有高達96個核,4線程/核心,每個插槽的總計算能力達到384線程。內存接口支持8通道DDR4-3200,每個通道可搭載2個DIMM。I/O擴展提供了64個PCIe Gen 4.0通道,搭載16個控制器。該處理器支持單節點和雙節點配置。在浮點運算方面,ThunderX3的每個核心搭載四個128位SIMD (Neon)單元。該設備完全符合SBSA/SBBR,并提供了企業級的RAS和虛擬化功能。
?ThunderX3的性能改進如何實現?Marvell半導體公司服務器處理器部產品營銷高級總監周立新告訴<電子發燒友>,主要來自于微架構的改進,使得IPC的整體性能較ThunderX2提高25%。結合處理器頻率和DDR頻率的提升,單線程總體性能較上一代提高了60%以上。在單顆處理器層面,相較于ThunderX2,ThunderX3的整數運算性能提升3倍以上,浮點運算性能提升5倍以上。
那么,對于HPC市場來說,需要什么樣的性能?周立新表示,HPC需要很多并行處理,ThunderX3每一個核有4個線程,最多96個核,可以支持384個線程。他強調,單核支持四線程,不論是x86架構還是其它Arm處理器,目前都沒有實現,ThunderX3在這方面實現了“數量級的差異”。
四線程跟單線程比,究竟有什么好處?可以主要從三方面來看,一是SPECCPU,這是最標準的衡量服務器的指標;二是MySQL數據庫;三是Web搜索。根據測算,四線程比單線程有顯著的性能提升,特別是MySQL,可以提高80%的性能。

當然,CPU不僅僅是計算指標,還涉及先進的DDR、PCIe。ThunderX3采用了PCIe 4.0,當年在ThunderX2,每個核里面有2個128bit SIMD (Neon) Units,而ThunderX3提升到4個,這對超算、AI和機器學習來說非常重要。
談及對比于x86架構處理器的主要優勢,Gopal Hegde表示,x86架構面向服務器、桌面等眾多市場,而Armv8-A是專門面向服務器應用開發的核,在面積、性能、功耗層面更加優化。x86架構兩大廠商:英特爾在工藝上相比臺積電已落后一兩代,這對其x86服務器CPU性能有一定的影響;AMD在架構上采用封裝集成,64核有9個Die,相應地在延時、帶寬方面存在不足,同時功耗偏高。
未來可能考慮Chiplet
各家由于情況不同,也有各自的實現路徑。比如AMD,其EYPC系列的成功與Chiplet技術的采用密不可分,它作為一種解決物理瓶頸的方法,Marvell是否會予以考慮?Gopal Hegde談到,當時AMD的EPYC,如果把32核放在同一芯片中,物理上首先難以量產,就算生產出良率會比較差,所以不得不用4個Die來做32核。Marvell每個核的尺寸比AMD的約小30%左右,所以在ThunderX3中還可以集成這么多核。他談到了一些不采用chiplet的優勢,比如內存帶寬,而且延遲也比較短。不過,未來再往下走,就算核再小早晚也會碰到物理瓶頸,那時可能也會考慮Chiplet方案。
盤點Arm服務器陣營的底氣
從Arm進入服務器市場的第一天起,整個業界就充滿了懷疑的論調,這種唱衰一路貫穿,甚至在高通正式取消其服務器芯片項目時達到頂峰。不過,后面的故事越來越精彩,2017年,英特爾前高管離職創辦了從事Arm 服務器芯片研發的Ampere公司;2018年,富士通公開介紹了業界首款支持基于ArmV8指令集擴展SVE(Scalable Vector Extension)的A64FX芯片,據稱性能強悍到無需與GPU組合;2019年AWS推出的Graviton 2堪稱驚艷……
事實上,也正是從去年開始,業界推出Arm服務器處理器的節奏明顯加快,性能PK也更為激烈。國產陣營的代表有飛騰和華為,作為國內最早獲得ARMv8指令集架構授權的設計廠商,飛騰的CPU產品近年來不論是性能還是生態都成果頗豐;還有華為鯤鵬,正在通過全生態體系和產業鏈的整合能力高歌猛進。
為什么Arm服務器生態開始呈現出前所未有的繁榮景象?Gopal Hegde認為,最顯著的原因是最終用戶發現Arm加速應用的時機已經成熟,才會有越來越多的人投入。
Arm框架的核心優勢在于低能耗、移動市場的高占比。但是,服務器是一個跟生態密切相關的業務,現在整個市場x86架構還是占據了90%以上的份額。本文發布之時,英特爾剛剛公布了2020年第一季度財報,其中數據中心業務同比增長43%,個中原因這里不去深究,但足以見得Marvell等面臨的是怎樣的對手。
那么,Marvell競爭的底氣來自哪里?
Gopal Hegde表示,生態層面其實是一種“滾雪球”效應,滾到一定地步就會自己越滾越大。自前兩年推出ThunderX2之后,部署進度在不斷加速,得到了諸多OEM廠商和平臺、IHV硬件廠商、操作系統和固件、中間件、應用和工具的支持,目前生態系統覆蓋已超過100家合作伙伴企業。微軟正為Azure部署基于ThunderX2的量產級服務器,也公開表態未來可能有40%-50%的量遷移到Arm平臺上。此外,ThunderX2系列服務器處理器已實現對NVIDIA GPU的支持,將進一步滿足HPC 和游戲應用的需求。
比較聰明的一點是,正如Gopal Hegde在采訪中所澄清的,Marvell并非全線與x86競爭,只主抓生態成熟、且成長非常快的領域,就是超算和云這兩塊,企業級的市場不會進入。
Arm架構在服務器市場進入了關鍵時期。諸多創新場景帶來的海量數據計算、存儲需求將孕育龐大的云服務市場,對基礎計算架構產生了真正的多元化的需求。而先進算力的提升也確實需要多元化的構建,眼下這種繁榮的生態景象正是行業所需要的。
本文由電子發燒友網原創,未經授權禁止轉載。如需轉載,請添加微信號elecfans999.
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
ARM
+關注
關注
135文章
9553瀏覽量
391885 -
服務器
+關注
關注
14文章
10253瀏覽量
91487 -
X86
+關注
關注
5文章
300瀏覽量
45434 -
高性能計算
+關注
關注
0文章
96瀏覽量
13810 -
超算
+關注
關注
1文章
118瀏覽量
9532
發布評論請先 登錄
相關推薦
熱點推薦
全球首創!RISC-V+AI架構高性能服務器CPU成功點亮
電子發燒友網報道 長久以來,全球高端服務器CPU市場一直被x86和ARM架構所主導,我國在核心算力領域長期受制于人,高端芯片供應鏈安全面臨重大挑戰。 ? 近日,藍芯算力(深圳)科技有限
英特爾服務器CPU市場失守:從99.9%到50%以下
電子發燒友網綜合報道,近日,市場調研機構 IDC 更新了全球服務器市場的最新情況。該機構預計,2025 年全球 x86 服務器的市場價值將同比增長 39.9%,達到 2839 億美元;非 x8
KaihongOS桌面版成功適配x86設備,邀您搶先體驗!
2025年6月30日,KaihongOS桌面版已成功適配x86設備,首次開啟開發者Beta體驗!我們誠邀您參與本次體驗計劃,共同探索國產操作系統的創新與潛力。您的反饋將幫助我們優化系統,打造更穩
打破X86/ARM壟斷!國產全新自主架構CPU處理器重磅發布
3C6000系列、工控及移動終端處理器龍芯2K3000/3B6000M,以及相關整機和解決方案,標志著龍芯在自主芯片領域又邁出了堅實的一步。 ? 龍芯中科董事長胡偉武在發布會上表示:“我國信息產業的根本出路在于構建獨立于
聚徽廠家視角——X86 架構 vs. ARM 架構:工控一體機的算力、功耗與成本差異解析
在工業自動化不斷發展的當下,工控一體機作為核心設備,其架構選擇至關重要。X86 架構與 ARM 架構在工控領域各領風騷,它們在算力、功耗與成本上的顯著差異,決定了其適用場景的不同。深入剖析兩者特點
奇瑞瑞虎8L問鼎2025環塔T1.1組總冠軍
當大漠黃沙退去,冠軍光芒劃破天際。近日,2025中國環塔(國際)拉力賽在新疆圓滿落幕。賽事歷經13天殘酷鏖戰,約5000多公里、4大營地與10個高強度賽段的正面交鋒,T1、T2等各組別的冠軍塵埃落定。
高端芯片自研,服務器芯片傳來好消息!
電子發燒友網報道(文/黃晶晶)當前,自研處理器已經跨過了能用的階段,逐漸走向好用,但無論是消費級還是服務器級都面臨著如何在性能上接近國外高端產品,以及生態上如何更加完善的問題。國內廠商對于服務器
ARM服務器解決方案
ARM服務器解決方案已成為異構計算領域的重要技術路徑,其核心優勢與多元化場景適配性正加速產業滲透。以下為關鍵要點分析: 一、核心優勢與架構設計 能效比優化? ARM架構基于RISC指令集,單節點功耗
服務器CPU架構解析,從x86到ARM:一文吃透其分類及對應品牌優勢
為什么你的服務器總在"喘氣"?CPU架構才是關鍵。大家可能都遇到過這樣的情況:公司剛采購的服務器用了不到半年,跑個數據庫就像老牛拉車,加內存換硬盤都沒用。這時候老工程師會叼著煙告訴你:"小伙子,問題出在CPU架構上!"
雙倍能效陣列云,重新定義服務器性價比
力高達48TOPS*72,滿足高并發AI訓練需求?。 ARM架構通過多核并行計算與動態電源管理技術,實現“按需供電”,單位機架算力密度顯著提升,功耗較傳統x86服務器降低30%-50%?。 ?先進制程與能效優化? 采用4nm工藝
與x86正面交鋒,Arm服務器芯片又掀狂瀾
評論