電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在亞馬遜、英偉達(dá)和阿里巴巴等廠商紛紛圍繞Arm Neoverse架構(gòu)打造服務(wù)器處理器之際,Ampere Computing選擇了一條與眾不同的路線,自研核心。近日,Ampere宣布推出全新的AmpereOne系列處理器,可配置多達(dá)192個(gè)核心,且這些都是基于Ampere自有IP打造的自研核心。
Ampere Altra到AmpereOne,Ampere的自研之路
憑借前兩代Ampere Altra系列產(chǎn)品80核Ampere Altra和128核Ampere Altra Max,Ampere成了在Arm服務(wù)器CPU領(lǐng)域的先行者之一。主流的大型云服務(wù)廠商(CSP)都已經(jīng)推出了基于這兩款CPU的服務(wù)器,如京東云就在近日推出了其首款基于Arm架構(gòu)的云主機(jī),搭載的正是Ampere Altra Max CPU。
CSP廠商紛紛擁抱Arm的原因很簡單,高并發(fā)、高算力和更低的價(jià)格,為上云提供了極具性價(jià)比的選擇。但如何做好差異化,是每個(gè)Arm服務(wù)器CPU廠商都需要思考的問題,比如英偉達(dá)選擇了與自己的GPU結(jié)合打造Grace Hopper這樣的SuperChip。
而擁有Arm ISA架構(gòu)授權(quán)的Ampere選擇了從微架構(gòu)上進(jìn)一步創(chuàng)新,打造自研的Arm云原生核,從絕對(duì)性能和可擴(kuò)展性上超越同類產(chǎn)品。單個(gè)AmpereOne CPU的可配置核心已經(jīng)達(dá)到192個(gè),比上一代的Ampere Altra Max多出了50%,內(nèi)核數(shù)為業(yè)界最高。
這意味著基于AmpereOne CPU的單機(jī)架性能將再創(chuàng)新高,為了匹配新CPU強(qiáng)大計(jì)算能力,AmpereOne還采用了8通道DDR5、128通道PCIe 5.0和更大私有緩存的設(shè)計(jì),斷絕了內(nèi)存帶寬和I/O性能上出現(xiàn)瓶頸的可能。針對(duì)高速增長的云原生應(yīng)用,AmpereOne還集成了一系列新特性,包括網(wǎng)格擁塞管理、細(xì)粒度電源管理和內(nèi)存標(biāo)簽等。Ampere表示,AmpereOne將幫助該公司進(jìn)一步擴(kuò)大在每機(jī)架性能方面的優(yōu)勢。
Ampere首席產(chǎn)品官Jeff Wittich:“192 核是一個(gè)非常大的數(shù)字,比英特爾和 AMD 要多很多。用一個(gè)具體的場景來說明,在云環(huán)境中運(yùn)行虛擬機(jī)時(shí),用192核的AmpereOne對(duì)比96核的AMD Genoa,或者60核的英特爾Sapphire Rapids,AmpereOne每機(jī)架運(yùn)行的虛擬機(jī)數(shù)量是AMD Genoa的2.9倍,是英特爾Sapphire Rapids的4.3倍。”
AmpereOne發(fā)力Chiplet與AI推理
得益于工藝的進(jìn)步和架構(gòu)的創(chuàng)新,AmpereOne能做到如此規(guī)格似乎并不意外,但能在Ampere Altra Max面世后的短時(shí)間內(nèi)推出這樣一個(gè)“性能怪獸”,其實(shí)也離不開在設(shè)計(jì)方法上的轉(zhuǎn)變。從AmpereOne的架構(gòu)可以看出,與此前Ampere Altra系列不同的是,新的處理器轉(zhuǎn)為采用Chiplet設(shè)計(jì)。近來不少先進(jìn)芯片設(shè)計(jì)中都采用了這一技術(shù),電子發(fā)燒友網(wǎng)也就這一轉(zhuǎn)變?cè)儐柫薃mpere,Chiplet究竟有何助力,是否加快了芯片設(shè)計(jì)周期?
Jeff Wittich指出:“綜合而言,我們?cè)贏mpere中轉(zhuǎn)為大量采用小芯片帶來了許多的優(yōu)勢,其中第一點(diǎn)就是能夠有更高的靈活度,第二點(diǎn)就是如問題中提到的,幫助我們加快了整個(gè)芯片設(shè)計(jì)周期。在采用了Chiplet架構(gòu)之后,產(chǎn)品的TTM也會(huì)隨之縮短,還可以提供更高的可擴(kuò)展性,從而提供現(xiàn)代云原生CPU的最佳性能。第三,Chiplet拓?fù)涞脑O(shè)計(jì)也可以使AmpereOne更輕易地實(shí)現(xiàn)內(nèi)存到內(nèi)核的訪問,而不需要為處理器引入額外的HOPs。”
另外值得注意的一點(diǎn)是,在早前的Ampere Altra系列CPU中,雖然也可以用于AI推理,但從CSP已發(fā)布服務(wù)器的定位來看,其主要還是用于Web服務(wù)、視頻編解碼以及云游戲等非AI應(yīng)用上。而此次發(fā)布的AmpereOne,則在AI計(jì)算上加大了力度。
?
AI推理性能對(duì)比 / Ampere
從性能對(duì)比上,我們可以看出AmpereOne在AI推理負(fù)載上的領(lǐng)先,比如在生成式AI和推薦算法上,AmpereOne的單機(jī)架性能是AMD EYPC 9654 Genoa的兩倍或以上,但兩者卻有著近乎相同的系統(tǒng)功耗,AmpereOne的優(yōu)勢在此展現(xiàn)得一覽無余。
這與Ampere自身的發(fā)展以及行業(yè)趨勢也緊密相關(guān),AI負(fù)載已經(jīng)成為云端最大的算力需求之一。而Ampere除了解決了AI硬件的問題外,也在布局AI軟件生態(tài)。比如2020年,Ampere收購了專注于打造AI軟件的OnSpecta,通過軟硬件協(xié)同優(yōu)化,為AmpereOne提供卓越的AI性能,比如對(duì)BF16精度的支持等等。
解決性能與能效的矛盾
在Ampere公布今年的路線圖時(shí),創(chuàng)始人/董事長兼首席執(zhí)行官Renée J. James表示:“Ampere已經(jīng)向行業(yè)證明,擊破單核性能與能耗之間的矛盾正是行業(yè)所有人都在尋找的新象限。在能耗與性能的坐標(biāo)軸之中,朝坐標(biāo)軸的右下方移動(dòng)是行業(yè)發(fā)展的新常態(tài),目的是實(shí)現(xiàn)更低的能耗和更高的性能。”
針對(duì)云計(jì)算的需求,在設(shè)計(jì)產(chǎn)品的過程中,Ampere借助Arm架構(gòu)的優(yōu)勢,綜合考量從核、SoC到等其他方面的因素,致力于實(shí)現(xiàn)每瓦性能、每機(jī)架性能的提升。對(duì)比x86架構(gòu)的CPU,Ampere Altra系列的的云原生處理器可以實(shí)現(xiàn)每機(jī)架2.5倍的性能提升,降低能耗2.8倍,并僅占用1/3的空間。而新發(fā)布的AmpereOne將幫助Ampere進(jìn)一步擴(kuò)大領(lǐng)先優(yōu)勢。
Jeff Wittich表示:“其實(shí)我們Ampere Altra系列處理器已經(jīng)提供了行業(yè)領(lǐng)先的單機(jī)架性能,在能效方面已經(jīng)是行業(yè)標(biāo)桿性的產(chǎn)品。不僅是在性能方面,在能效方面我們也是領(lǐng)先AMD和英特爾所有的產(chǎn)品,即使是他們近期發(fā)布的低功耗產(chǎn)品。”
寫在最后
誠然,對(duì)于大部分服務(wù)器CPU而言,面向的客戶都是CSP和服務(wù)器OEM廠商,而他們提高競爭力的方式之一即提供差異化的高質(zhì)量方案。不少Arm服務(wù)器CPU,雖然都在設(shè)計(jì)上做了差異化,但計(jì)算核心的性能并未拉開太大差距。Ampere選擇了自研云原生核的方式,既滿足了更高性能的需求,也解決了他們的另一大痛點(diǎn),可擴(kuò)展性與規(guī)模化。
成立5年多來,Ampere,已經(jīng)在x86壟斷的服務(wù)器市場占領(lǐng)了一席之地。在一切背后,是Ampere 認(rèn)為云需要一種從本質(zhì)上而言完全不同的方法。隨著所有的計(jì)算轉(zhuǎn)移到云端,整個(gè)平臺(tái)的云原生化趨勢不可避免,而Ampere正在做的就是為云原生進(jìn)行徹底的CPU創(chuàng)新。
Ampere Altra到AmpereOne,Ampere的自研之路

CSP廠商紛紛擁抱Arm的原因很簡單,高并發(fā)、高算力和更低的價(jià)格,為上云提供了極具性價(jià)比的選擇。但如何做好差異化,是每個(gè)Arm服務(wù)器CPU廠商都需要思考的問題,比如英偉達(dá)選擇了與自己的GPU結(jié)合打造Grace Hopper這樣的SuperChip。
而擁有Arm ISA架構(gòu)授權(quán)的Ampere選擇了從微架構(gòu)上進(jìn)一步創(chuàng)新,打造自研的Arm云原生核,從絕對(duì)性能和可擴(kuò)展性上超越同類產(chǎn)品。單個(gè)AmpereOne CPU的可配置核心已經(jīng)達(dá)到192個(gè),比上一代的Ampere Altra Max多出了50%,內(nèi)核數(shù)為業(yè)界最高。
這意味著基于AmpereOne CPU的單機(jī)架性能將再創(chuàng)新高,為了匹配新CPU強(qiáng)大計(jì)算能力,AmpereOne還采用了8通道DDR5、128通道PCIe 5.0和更大私有緩存的設(shè)計(jì),斷絕了內(nèi)存帶寬和I/O性能上出現(xiàn)瓶頸的可能。針對(duì)高速增長的云原生應(yīng)用,AmpereOne還集成了一系列新特性,包括網(wǎng)格擁塞管理、細(xì)粒度電源管理和內(nèi)存標(biāo)簽等。Ampere表示,AmpereOne將幫助該公司進(jìn)一步擴(kuò)大在每機(jī)架性能方面的優(yōu)勢。
Ampere首席產(chǎn)品官Jeff Wittich:“192 核是一個(gè)非常大的數(shù)字,比英特爾和 AMD 要多很多。用一個(gè)具體的場景來說明,在云環(huán)境中運(yùn)行虛擬機(jī)時(shí),用192核的AmpereOne對(duì)比96核的AMD Genoa,或者60核的英特爾Sapphire Rapids,AmpereOne每機(jī)架運(yùn)行的虛擬機(jī)數(shù)量是AMD Genoa的2.9倍,是英特爾Sapphire Rapids的4.3倍。”
AmpereOne發(fā)力Chiplet與AI推理
得益于工藝的進(jìn)步和架構(gòu)的創(chuàng)新,AmpereOne能做到如此規(guī)格似乎并不意外,但能在Ampere Altra Max面世后的短時(shí)間內(nèi)推出這樣一個(gè)“性能怪獸”,其實(shí)也離不開在設(shè)計(jì)方法上的轉(zhuǎn)變。從AmpereOne的架構(gòu)可以看出,與此前Ampere Altra系列不同的是,新的處理器轉(zhuǎn)為采用Chiplet設(shè)計(jì)。近來不少先進(jìn)芯片設(shè)計(jì)中都采用了這一技術(shù),電子發(fā)燒友網(wǎng)也就這一轉(zhuǎn)變?cè)儐柫薃mpere,Chiplet究竟有何助力,是否加快了芯片設(shè)計(jì)周期?
Jeff Wittich指出:“綜合而言,我們?cè)贏mpere中轉(zhuǎn)為大量采用小芯片帶來了許多的優(yōu)勢,其中第一點(diǎn)就是能夠有更高的靈活度,第二點(diǎn)就是如問題中提到的,幫助我們加快了整個(gè)芯片設(shè)計(jì)周期。在采用了Chiplet架構(gòu)之后,產(chǎn)品的TTM也會(huì)隨之縮短,還可以提供更高的可擴(kuò)展性,從而提供現(xiàn)代云原生CPU的最佳性能。第三,Chiplet拓?fù)涞脑O(shè)計(jì)也可以使AmpereOne更輕易地實(shí)現(xiàn)內(nèi)存到內(nèi)核的訪問,而不需要為處理器引入額外的HOPs。”
另外值得注意的一點(diǎn)是,在早前的Ampere Altra系列CPU中,雖然也可以用于AI推理,但從CSP已發(fā)布服務(wù)器的定位來看,其主要還是用于Web服務(wù)、視頻編解碼以及云游戲等非AI應(yīng)用上。而此次發(fā)布的AmpereOne,則在AI計(jì)算上加大了力度。
?AI推理性能對(duì)比 / Ampere
從性能對(duì)比上,我們可以看出AmpereOne在AI推理負(fù)載上的領(lǐng)先,比如在生成式AI和推薦算法上,AmpereOne的單機(jī)架性能是AMD EYPC 9654 Genoa的兩倍或以上,但兩者卻有著近乎相同的系統(tǒng)功耗,AmpereOne的優(yōu)勢在此展現(xiàn)得一覽無余。
這與Ampere自身的發(fā)展以及行業(yè)趨勢也緊密相關(guān),AI負(fù)載已經(jīng)成為云端最大的算力需求之一。而Ampere除了解決了AI硬件的問題外,也在布局AI軟件生態(tài)。比如2020年,Ampere收購了專注于打造AI軟件的OnSpecta,通過軟硬件協(xié)同優(yōu)化,為AmpereOne提供卓越的AI性能,比如對(duì)BF16精度的支持等等。
解決性能與能效的矛盾

針對(duì)云計(jì)算的需求,在設(shè)計(jì)產(chǎn)品的過程中,Ampere借助Arm架構(gòu)的優(yōu)勢,綜合考量從核、SoC到等其他方面的因素,致力于實(shí)現(xiàn)每瓦性能、每機(jī)架性能的提升。對(duì)比x86架構(gòu)的CPU,Ampere Altra系列的的云原生處理器可以實(shí)現(xiàn)每機(jī)架2.5倍的性能提升,降低能耗2.8倍,并僅占用1/3的空間。而新發(fā)布的AmpereOne將幫助Ampere進(jìn)一步擴(kuò)大領(lǐng)先優(yōu)勢。
Jeff Wittich表示:“其實(shí)我們Ampere Altra系列處理器已經(jīng)提供了行業(yè)領(lǐng)先的單機(jī)架性能,在能效方面已經(jīng)是行業(yè)標(biāo)桿性的產(chǎn)品。不僅是在性能方面,在能效方面我們也是領(lǐng)先AMD和英特爾所有的產(chǎn)品,即使是他們近期發(fā)布的低功耗產(chǎn)品。”
寫在最后
誠然,對(duì)于大部分服務(wù)器CPU而言,面向的客戶都是CSP和服務(wù)器OEM廠商,而他們提高競爭力的方式之一即提供差異化的高質(zhì)量方案。不少Arm服務(wù)器CPU,雖然都在設(shè)計(jì)上做了差異化,但計(jì)算核心的性能并未拉開太大差距。Ampere選擇了自研云原生核的方式,既滿足了更高性能的需求,也解決了他們的另一大痛點(diǎn),可擴(kuò)展性與規(guī)模化。
成立5年多來,Ampere,已經(jīng)在x86壟斷的服務(wù)器市場占領(lǐng)了一席之地。在一切背后,是Ampere 認(rèn)為云需要一種從本質(zhì)上而言完全不同的方法。隨著所有的計(jì)算轉(zhuǎn)移到云端,整個(gè)平臺(tái)的云原生化趨勢不可避免,而Ampere正在做的就是為云原生進(jìn)行徹底的CPU創(chuàng)新。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
ARM
+關(guān)注
關(guān)注
135文章
9553瀏覽量
391880 -
cpu
+關(guān)注
關(guān)注
68文章
11279瀏覽量
224982 -
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301395 -
Ampere
+關(guān)注
關(guān)注
1文章
81瀏覽量
4888
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
成功點(diǎn)亮并上車!對(duì)標(biāo)Orin X,Momenta自研芯片來了
年時(shí)間,其自研芯片也終于接近落地。 ? 對(duì)標(biāo)Orin-X,接口兼容8650,目標(biāo)快速上車 ? 據(jù)透露,Momenta自研的智駕芯片性能上對(duì)標(biāo)
憶聯(lián)正式推出面向PCIe 5.0的自研M.2 SLT測試系統(tǒng)
SLT(System Level Test)測試系統(tǒng)是半導(dǎo)體制造與電子工業(yè)的核心質(zhì)量關(guān)口,對(duì)于固態(tài)硬盤(SSD)而言,該系統(tǒng)不僅是生產(chǎn)流程中的必要環(huán)節(jié),更是確保產(chǎn)品最終性能、可靠性與終端用戶
深入解析SN75ALS192:高性能四路差分線驅(qū)動(dòng)器
深入解析SN75ALS192:高性能四路差分線驅(qū)動(dòng)器 在硬件設(shè)計(jì)領(lǐng)域,數(shù)據(jù)傳輸?shù)姆€(wěn)定性和高效性是至關(guān)重要的。今天我們要探討的SN75ALS192四路差分線驅(qū)動(dòng)器,就是一款在數(shù)據(jù)傳輸方面表現(xiàn)卓越的器件
京東自研電商數(shù)據(jù)庫內(nèi)核DongSQL簡介
團(tuán)隊(duì)于今年(2025.9)打磨出了深度優(yōu)化的自研數(shù)據(jù)庫內(nèi)核——DongSQL V1.1.0。
1600TOPS!美國新勢力車企自研5nm芯片,轉(zhuǎn)用激光雷達(dá)硬剛特斯拉
電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)新勢力車企自研芯片似乎已經(jīng)成為一個(gè)共識(shí),近年來,蔚來、小鵬陸續(xù)實(shí)現(xiàn)了自研自動(dòng)駕駛芯片的上車,理想也預(yù)計(jì)2026
亞馬遜新一代自研服務(wù)器芯片Graviton5問世,性能提升25%
,基于Graviton5的全新EC2 M9g實(shí)例性能提升高達(dá)25%,其每個(gè)芯片配備192核及5倍擴(kuò)容緩存,助力客戶在擴(kuò)展工作負(fù)載、提升應(yīng)用性能的同時(shí)降低基礎(chǔ)設(shè)施成本。 ? Graviton5性
季豐電子自研PCB管理系統(tǒng)的簡單介紹
季豐電子自研的PCB管理系統(tǒng),整合報(bào)價(jià)+投板+Release三大核心模塊,覆蓋從設(shè)計(jì)發(fā)布、訂單對(duì)接到生產(chǎn)交付的全業(yè)務(wù)流程。
江波龍自研UFS4.1主控芯片,順序讀取速率高達(dá)4350MB/s,性能對(duì)標(biāo)主流產(chǎn)品
電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近年來,江波龍自研主控芯片取得較大的進(jìn)展。截止至2025年7月底,江波龍主控芯片全系列產(chǎn)品累計(jì)實(shí)現(xiàn)超過8000萬顆的批量部署,并且部署規(guī)模仍在保持快速增長。 ? 據(jù)了解
東風(fēng)風(fēng)神L8搭載自研馬赫動(dòng)力電池
近日,東風(fēng)新旗艦東風(fēng)風(fēng)神L8正式開啟預(yù)售,聚焦家庭用車核心需求,該車搭載東風(fēng)自研“馬赫動(dòng)力電池”打造主流家庭的“質(zhì)價(jià)比之王”。
Arm CEO:公司正在自研芯片
據(jù)外媒路透社報(bào)道,Arm CEO Rene Haas透露,Arm正在投資開發(fā)自有芯片,并計(jì)劃將部分利潤投資于制造自己的芯片和其他組件。與之對(duì)應(yīng)的是Arm預(yù)測的下一財(cái)季經(jīng)營業(yè)績也會(huì)因?yàn)?b class='flag-5'>自研芯片而減低
國產(chǎn)真自研高性能圖形 GPU 重磅發(fā)布:跑分超 RTX4060,暢玩《黑神話?悟空》
系列。 ? 礪算科技創(chuàng)始人、CEO 宣以方表示,礪算 7G100 系列 GPU 從計(jì)算核心到指令集完全由自主設(shè)計(jì),基于自研 “天圖” 架構(gòu),并配備自
發(fā)表于 07-26 21:45
?6078次閱讀
又一顆國產(chǎn)GPU芯片成功點(diǎn)亮!6nm制程,自研TrueGPU架構(gòu)
款GPU芯片G100采用6nm制程,基于自研的TrueGPU架構(gòu),這是全球首個(gè)融合高性能圖形渲染與AI推理能力的GPU架構(gòu)。其核心優(yōu)勢在于通過unified shader+tensor
發(fā)表于 05-29 00:48
?2726次閱讀
高端芯片自研,服務(wù)器芯片傳來好消息!
電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)當(dāng)前,自研處理器已經(jīng)跨過了能用的階段,逐漸走向好用,但無論是消費(fèi)級(jí)還是服務(wù)器級(jí)都面臨著如何在性能上接近國外高端產(chǎn)品,以及生態(tài)上如何更加完善的問題。國內(nèi)廠商對(duì)于服務(wù)器芯片
自研MCU芯片閃存驅(qū)動(dòng)的實(shí)現(xiàn):OpenOCD詳細(xì)過程記錄與操作指南
在嵌入式系統(tǒng)開發(fā)領(lǐng)域,MCU(微控制單元)芯片在眾多智能設(shè)備中發(fā)揮著核心的控制作用,其性能優(yōu)化與功能拓展一直是技術(shù)發(fā)展的重要方向。OpenOCD(Open On-Chip Debugger)作為一個(gè)
研華工控機(jī)610L深度解析:性能優(yōu)勢、應(yīng)用場景與選型指南
優(yōu)化等維度,全面解析“ 研華工控機(jī)610L ”的核心價(jià)值,為工業(yè)用戶提供選型與使用參考。 一、研華工控機(jī)610L的核心性能優(yōu)勢 1.工業(yè)級(jí)結(jié)構(gòu)設(shè)計(jì)
192個(gè)自研核心,AmpereOne的絕對(duì)性能壓制
評(píng)論