龍芯2K3000是龍芯中科推出的一款主打性價比的工控CPU產品,基于龍芯LA364處理器核。LA364的規格只有龍芯高端核心LA664的一半,與Intel CPU的小核對標。龍芯2K3000的市場定位也與Intel i3-N系列相似。盡管它們每GHz的性能相近,但因為Intel i3-N系列采用了更先進的Intel 7工藝,所以頻率上限更高,那么性能也就應該更高。
只是由于兩者的資料并不詳盡,很難直觀地對比性能。為了探究這個問題,筆者從“集特智能(GitStar)”公司借到了一塊搭載了龍芯2K3000的工控主板,又找了一臺基于Intel i3-N305的袖珍主機,對兩者進行相同的測試,以便直接對比差距。
2K3000和i3-N305的主機功率測試
龍芯2K3000有4核和8核兩個型號,主頻也從2.0GHz到2.5GHz有多個版本。它還有個兄弟型號是龍芯3B6000M,主要面向筆記本電腦、袖珍主機等消費級市場。兩者規格與性能相同,僅封裝形式不同。
集特智能的這款型號為GM7-3601-01的產品是工控主板,對穩定性的要求大于性能,因此搭載的是8核2.2GHz的2K3000,而不是2.5GHz的版本。作為對手的i3-N305也是8個核心,但睿頻高達3.8GHz,看起來它們并不是同一個級別的對手。
2K3000支持的內存是DDR4-3200單通道,i3-N305則支持DDR5-4800單通道。內存帶寬的差距也會造成性能差距,特別是在多任務并行時,內存瓶頸對性能發揮的不良影響尤其明顯。不過i3-N305的TDP僅15W,在限制TDP的情況下必然不會長時間保持較高睿頻。特別是多核并行的時候頻率會進一步降低,因此兩者的實際性能差距可能并不那么大。

TDP不是CPU的最大功耗,而是為主板和整機的散熱設計提供的指導意見。在未解鎖TDP時,i3-N305主機在CPU空閑時的功率是7W左右,但峰值功率超過37W,此時的CPU功率應該有30W以上。這樣的功率明顯超出了這臺主機散熱及供電的安全閾值,因為配套的電源適配器額定功率才36W(12V3A)。

如果不限制CPU功率,那么在進行視頻編碼解碼、UnixBench測試、HPL測試等任務時,i3-N305主機峰值功率會超過50W,此時CPU本身的功率應該已經超過40W。在這種情況下進行性能測試,對于這臺迷你電腦而言,就是一種作死的行為藝術。
如果不是跑分而是實際使用,那就更無法預料CPU功率什么時候會超出安全閾值。雖然解除功耗限制后,在不同的測試項目中i3-N305的多核并行性能可提高10%至20%不等,但若硬件隨時面臨損壞風險就沒有實際意義。因此在后面的性能測試中,都不使用激進的功耗控制策略。

龍芯2K3000雖然峰值功率低于i3-N305,但多數時間的功率比Intel i3-N305更高。主要原因在兩個方面:一是工藝落后,二是動態調頻調壓的功能沒有啟用。2K3000的硬件是支持動態調頻調壓的,但操作系統始終沒有完成支持,導致CPU在空閑時仍然維持在最高頻率。龍芯如果不盡快完善自動降頻的功能,那么在用于筆記本等移動設備時是比較吃虧的。
DDR4與DDR5,內存帶寬差距明顯
龍芯2K3000支持DDR4-3200,Intel i3-N305支持DDR5-4800。雖然都只有一個內存通道,但在內存訪問速率方面i3-N305必然有優勢。

以往任何國產CPU都對內存很挑剔,不使用國產CPU專門適配過的“信創內存”可能就無法點亮。龍芯CPU的內存兼容性現在有很大改觀,現在由于內存供應緊張,線上平臺已經沒有零售的“信創內存”了,筆者在某魚隨機買了兩條DDR4筆記本內存,它們都能在2K3000上正常使用。
但兼容不代表能完美地發揮性能,在使用這些內存時,2K3000多線程的內存訪問速率反而比單線程還低。一條海力士16G的,單線程內存Copy速率約為17GB/s,多線程降到14GB/s。另一條金士頓32G的,多線程速率甚至只有10GB/s左右,可能比完美適配的內存低了一半。既然有更慢的,那么就肯定有更快的,因此筆者認為內存速率低是未適配的原因,而不是2K3000的內存控制器只有這樣的水準。

Intel和AMD也有類似的問題,不同的內存即使時序參數完全相同,在同一顆CPU上的實際速率也有差距。但我為Intel i3-N305準備的32G海力士DDR5內存發揮正常,單線程內存Copy速率約為14GB/s,多線程接近22GB/s,使它在多任務并行時能更少地遭遇內存速率瓶頸。
在內存適配不對等的情況下對比兩者性能,對2K3000有失公平。但是連生產工藝不對等這種更嚴重的不公平都已經忍受了,那么再增加一些不公平也沒什么大不了。反正2K3000沒說話,我就當他同意了。
7zip多線程文件壓縮解壓測試
文件壓縮和解壓是常用的功能,本次使用Deepin V25系統和自帶的7zip 16.02進行測試。使用了來自一個視頻編碼測試資源網站的YUV序列文件進行實際的壓縮解壓操作,文件大小為42GB。

壓縮文件時使用默認的參數,但開啟多線程支持。i3-N305壓縮這個42GB的文件耗時171分33秒,2K3000耗時187分2秒,落后不到10%。把壓縮得到的文件解壓,i3-N305耗時23分24秒,2K3000耗時18分33秒,速度快25%以上。2K3000在文件壓縮解壓方面的綜合表現優于i3-N305,而且這只是2.2GHz的2K3000。
但如果看7zip的benchmark測試分數,那么i3-N305反而優于2K3000。特別是壓縮得分要比2K3000高45%,而不是實際的不到10%的差距。這說明跑分成績不能代表實際的壓縮解壓速度,x86架構的7zip跑分相對于龍芯LoongArch架構有一些虛高。
另外,不同版本的7zip測試成績也不能相互對比。而且7zip的測試成績只能反映CPU壓縮和解壓文件的性能,而不能代表CPU的綜合性能。
SPEC CPU 2017通用性能測試
SPEC CPU 是相對權威的CPU性能評估工具。這次使用SPEC CPU 2017分別測試單核、4核并行、8核并行的成績。操作系統是Deepin V25,編譯器是開源上游的GCC16。編譯參數主要是“-O3 -march=native -staic -flto”以及與CPU指令集對應的開啟向量的參數。
其中的“-march=native”實際上對2K3000是無效的,因為2K3000的微架構在GCC編譯器中還缺少對應的優化。編譯時會給出信息“unknown processor ID '0x14b020', some tuning parameters will fall back to default”,意思是因為不認識這顆新CPU,所以取消了部分編譯優化。這對2K3000當然也不公平,但往好的地方想,等以后編譯器對2K3000支持完善了,不就等于免費升級性能嗎?現在就別挑剔了,將就測吧!
因為i3-N305單核最高睿頻達3.8GHz,所以單核性能遠高于2K3000。但4核并行時CPU頻率就嚴重下降,成績只比4核并行的2K3000高6%。當然這并非i3-N305的性能極限,而是功耗和溫度保持在安全閾值之內時的極限。同樣,2K3000也未到極限,它有2.5GHz的版本,也有適配更好的內存,還有將來增加了微架構優化的編譯器,任何一項改善都能使測試成績更高。

在8核并行的時候,內存帶寬對2K3000的拖累加重,CPU并行效率嚴重下降。單通道DDR4在面對8核并行時還是太勉強了,i3-N305的單通道DDR5對并行性能的影響就小得多。前面2K3000的7zip測試表現較好,是因為文件壓縮和解壓相對于SPEC CPU測試來說不算是內存密集型應用。
正如7zip的測試成績不等于實際的壓縮和解壓速度,實際應用的表現也不會與性能測試的成績比例一致。2K3000和i3-N305本就不適合重負載的應用,而像WPS、微信、瀏覽器這類軟件對內存帶寬的依賴比7zip還低得多,因此在2K3000和i3-N305上的實際性能表現會基本相同。
UnixBench系統綜合性能測試
大多數性能測試都是以硬件為主導,UnixBench測試則加大了操作系統的得分權重。例如創建進程、管道通信、腳本執行、小文件讀寫等測試項目都屬于操作系統可以拼命優化的范疇。盡管軟件功能的執行依賴硬件,但操作系統的優化可以讓硬件如虎添翼。
因為不同的操作系統對這種操作的優化程度不同,所以不能用不同系統下的UnixBench測試成績來對比硬件性能。為了證明這一點,筆者除了用Deepin V25測試2K3000和i3-N305,還用UOS 20進行了測試。但因為UOS系統在i3-305迷你電腦上未能啟動,所以只有2K3000的測試成績。

根據測試結果,在執行操作系統的基本功能時,2K3000單核比i3-N305更優,但8核并行仍然受到內存帶寬的不利影響。不過這樣的差距在實際使用中基本感受不到區別,可以算是同一水準。
UOS系統測出的單任務成績提高了近60%,并行成績幾乎翻倍。說明在UOS系統中進行打開程序、切換窗口、復制文件等日常操作時會更加流暢,這樣大的差距是能直觀體會到的。以前國產CPU性能較低,UOS這樣的信創操作系統為了改善用戶體驗,也算是竭盡全力了。
核顯性能足以勝任普通辦公用途
2K3000和i3-N305都集成了GPU,其中2K3000中集成的LG200是龍芯第二代自主GPU核心。基于同款GPU核心的獨立顯卡9A1000對標AMD RX550,核顯版的性能是9A1000的1/4,也是上一代7A2000橋片集顯LG100的4倍。
使用glmark2實測i3-N305集成的GPU,成績也僅比AMD RX550的1/4略高,那么2K3000和i3-N305的核顯性能應該比較接近才對。但是2K3000的核顯實測成績才715分,性能不到i3-N305的一半,甚至不到上一代集顯LG100的2倍,更遑論4倍性能。
硬件規格是確定的,那么同樣可以確定的就是驅動程序未能發揮出2K3000核顯的性能。如果2K3000中集成的LG200所表現的性能與紙面數據相符,那么圖形處理性能就與i3-N305的核顯相同了。驅動優化,任重道遠啊。
不過2K3000當前發揮的性能已經介于AMD R5-230和Radeon 520之間,作為“信創辦公顯卡”是合格的。i3-N305的核顯雖然圖形性能更高,但也同樣是“信創辦公顯卡”的范疇,和2K3000一樣只適合普通辦公軟件、輕量的CAD設計、視頻播放、常規視頻編輯、休閑游戲等。要是玩《黑神話·悟空》,那么幀率是2還是4有什么區別呢?
盡管2K3000當前的圖形處理性能不如i3-N305,但LG200在其他方面的優勢不小。
1.LG200集成了單獨的視頻處理模塊,在編碼解碼視頻時不占用GPU的圖形性能,對CPU的耗用也低。i3-N305沒有集成單獨的視頻處理模塊,硬件加速的視頻編碼解碼是依靠CPU和GPU混合運算,不是很適合同時執行其他耗用CPU或GPU的任務。
2.LG200是GPGPU,而不是單純的圖形處理器,提供了256GFlops的通用算力。如果軟件支持使用GPGPU進行通用計算,那么可以大幅度提高計算速度。
3.LG200集成了AI處理單元,算力為8TOPS,可以加速終端AI處理,并且不占用CPU和GPU的其他資源。
總結
2K3000和i3-N305的綜合性能比較接近,實際對比各有勝場,在多數應用中沒有可感知的差距。主要是在對內存帶寬極其依賴的應用中,2K3000的性能表現會明顯弱于i3-N305,但這一點也能改善。
在Linux系統下,龍芯的LoongArch指令集軟件生態已經逼近x86。未兼容龍芯LoongArch的商業軟件,包括大部分Windows軟件也能通過“二進制翻譯技術”運行。龍芯CPU早已脫離了軟件匱乏的境地,指令集的生態壁壘正在被龍芯消除。
龍芯2K3000和Intel i3-N系列市場定位相似,各種形態的產品價格也趨近。例如i3-N305工控主板的市售價一般在1500~2000之間,筆者測試的這款來自集特智能的龍芯2K3000工控主板也在同樣的價格區間。一些基于2K3000的低成本開發板、迷你電腦主板,也與基于Intel i3-N系列的對應產品一樣,實售價在1000左右。
龍芯在市場規模遠小于Intel的情況下,使CPU的性價比越來越貼近市場,既有助于龍芯發展,也有利于消除進口CPU的市場壟斷。
審核編輯 黃宇
-
主板
+關注
關注
54文章
2360瀏覽量
76815 -
龍芯
+關注
關注
3文章
428瀏覽量
32768
發布評論請先 登錄
Banana Pi 基于龍芯2K3000的國產信創工業計算網關設計,采用無風扇設計
集特龍芯2K3000主板適配麒麟系統:國產化工業控制的可靠之選
眺望電子率先發布龍芯2K3000全國產,工業級ITX主板
香蕉派 BPI-2K3000 工業計算機開發板采用龍芯2K3000芯片設計
龍芯國產主板,2K3000強勁芯,創造無限可能性
國產龍芯主板,自主可控,助力工業智能化實現跨越式發展
龍芯2K3000國產主板:強大內核,多元功能
喜訊 | 眺望電子2K3000工控系列入選龍芯中科伙伴產品
全方位解析,眺望電子2K3000核心板參數與設計
精彩回顧 | 眺望電子亮相2025龍芯產品發布暨用戶大會
迅龍軟件受邀參加2025龍芯產品發布暨用戶大會,發布基于龍芯2K3000的OrangePi Nova
龍芯2K3000 | 重塑工控嵌入式處理器性能邊界
龍芯2K3000與Intel i3-N305有多大差距?|集特主板實測
評論