国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在AArch64平臺上性能下降的例子

Linux閱碼場 ? 來源:openEuler ? 作者:吳言 ? 2021-09-09 11:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:目前許多公司同時使用 x86 和 AArch64 2 種主流的服務(wù)器。這兩種環(huán)境的算力相當,內(nèi)存相同的情況下:相同版本的 JVM 和 Java 應(yīng)用,相同的 JVM 參數(shù),應(yīng)用性能在不同的平臺中表現(xiàn)相差 30%,x86 遠好于 AArch64 平臺。本文分析了一個應(yīng)用在 AArch64 平臺上性能下降的例子,發(fā)現(xiàn) JVM 的 CodeCache 大小是引起這個性能問題的根源,進而研究什么導致了不同平臺上 CodeCache 大小的不同。最后筆者給出了不同平臺中該如何設(shè)置參數(shù)規(guī)避該問題。希望本文能給讀者一些啟示:當使用不同的硬件平臺時需要關(guān)注底層硬件對于上層應(yīng)用的影響。

業(yè)務(wù)在 x86 和 AArch64 上同時部署時(相同的 JDK 和 Java 應(yīng)用版本),發(fā)現(xiàn) AArch64 平臺性能下降嚴重問題。進一步查看日志,發(fā)現(xiàn)在 AArch64 平臺中偶有如下情況:

這代表 JVM 中的 CodeCache 滿了,導致編譯停止,未編譯的方法只能解釋執(zhí)行,進而嚴重影響應(yīng)用性能。那什么是 CodeCache?

CodeCache 是什么

簡單來說,CodeCache 用于存放編譯后的方法,主要分為三部分:

Non-nmethods:包括運行時 Stub,Adapter 等;

Profiled nmethod:包括會采集信息的方法,即分層編譯中第 2、3 層的方法;

Non-Profiled nmethods:包括不采集信息的方法,即分層編譯中第 1、4 層的方法,也包括 JNI 的方法。

注:分層編譯指的是 JVM 同時存在 C1 和 C2 兩種編譯器,C1 做一些簡單的編譯優(yōu)化,耗時較短,C2 做更多復雜的編譯優(yōu)化,性能較好,編譯耗時較多。分層編譯的觸發(fā)在 JVM 內(nèi)會根據(jù)相應(yīng)的條件進行觸發(fā),關(guān)于更多分層編譯相關(guān)知識可以參考相關(guān)資料 [1]。

在 JDK 9 之后 [2],這些會分配到不同的區(qū)域(使用不同區(qū)域的優(yōu)點:查找、回收等),JDK 8 中會分配到同一塊區(qū)域。

JVM 平時會清理一些不可達的方法,例如由于退優(yōu)化等產(chǎn)生的死方法,另外 UseCodeCacheFlushing 選項(默認開啟),還會清理較老以及執(zhí)行較少的方法。一旦 CodeCache 滿了之后,會停止編譯,直到 CodeCache 有空間,若關(guān)閉了 UseCodeCacheFlushing 選項,則會直接永久停止編譯。

不同的 JVM 版本以及不同的參數(shù),默認的 CodeCache 大小不同。JDK 11 中默認參數(shù)下 CodeCache 大小為 240M,若想獲取(確認)默認情況下的 CodeCache 大小,建議使用 - XX:+PrintFlagsFinal 選項獲取 ReservedCodeCache 的大小。

CodeCache 大小主要通過以下選項調(diào)節(jié):

InitialCodeCacheSize 初始的 CodeCache 大小(單位字節(jié))
ReservedCodeCacheSize 預(yù)留的 CodeCache 大小,即最大CodeCache 大小(單位字節(jié))
CodeCacheExpansionSize CodeCache 每次擴展大小(單位字節(jié))
Option Description

使用–XX:+PrintCodeCache 選項可以打印應(yīng)用使用的 CodeCache 情況,如下:

其中 max_used 表示應(yīng)用中使用到的 CodeCache 大小,據(jù)此可以設(shè)置合適的 ReservedCodeCacheSize 值。

AArch64 vs x86_64

我們都知道 AArch64 和 x86 分別為 RISC 和 CISC 架構(gòu),因此代碼密度方面存在一定差異,在這篇文章 [3] 中比較了不同指令集下手寫匯編的大小,可以看到 AArch64 的代碼密度是 RISC 架構(gòu)中較優(yōu)的,但相比 x86_64 仍稍差些(其中 RISC 最差,m68k 最好)。

另外筆者選用業(yè)界通用的 java 測試套 dacapo[4] 比較 AArch64 和 x86_64 下 CodeCache 占用的大小。

可以看到,在 AArch64 架構(gòu)下,CodeCache 均比 x86_64 要大,但根據(jù)不同場景,大小差距不同,在 5%-20% 之間。因此在我們發(fā)現(xiàn)相同應(yīng)用在 x86 和 AArch64 上時,CodeCache 大小需要進行相應(yīng)的調(diào)節(jié)。

除此之外,還需要注意 InlineSmallCode 選項,JVM 只會 inline 代碼體積比該值小的方法。JVM 通過 inline 可以觸發(fā)更多的優(yōu)化,因此 inline 對于性能提升也很重要。在 JDK 11 中,InlineSmallCode 在 x86 下的默認值為 2000 字節(jié),在 AArch64 下的默認值為 2500 字節(jié)。而 JDK 8 中,InlineSmallCode 在 x86 和 AArch64 下默認值均為 2000 字節(jié)。因此建議遷移時也相應(yīng)修改 InlineSmallCode 的值。業(yè)務(wù)通過對 CodeCache 相關(guān)參數(shù)的調(diào)整,達到助力 JIT 的最佳編譯效果。

后記

如果遇到相關(guān)技術(shù)問題(包括不限于畢昇 JDK),可以進入畢昇 JDK 社區(qū)查找相關(guān)資源(點擊原文進入官網(wǎng)),包括二進制下載、代碼倉庫、使用教學、安裝、學習資料等。畢昇 JDK 社區(qū)每雙周周二舉行技術(shù)例會,同時有一個技術(shù)交流群討論 GCC、LLVM、JDK 和 V8 等相關(guān)編譯技術(shù),感興趣的同學可以添加如下微信小助手,回復 Compiler 入群。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10251

    瀏覽量

    91480
  • JAVA
    +關(guān)注

    關(guān)注

    20

    文章

    3001

    瀏覽量

    116422
  • JVM
    JVM
    +關(guān)注

    關(guān)注

    0

    文章

    161

    瀏覽量

    13036

原文標題:相同版本 JVM 和 Java 應(yīng)用,在 x86 和AArch64 平臺性能相差30%,何故?

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何在Arm Neoverse N2平臺上提升llama.cpp擴展性能

    跨 NUMA 內(nèi)存訪問可能會限制 llama.cpp Arm Neoverse 平臺上的擴展能力。本文將為你詳細分析這一問題,并通過引入原型驗證補丁來加以解決。測試結(jié)果表明,基于 Neoverse N2
    的頭像 發(fā)表于 02-11 10:06 ?165次閱讀

    炎核開源開放平臺上架推出OpenSparseBlas高性能稀疏計算庫

    科學計算與工程仿真領(lǐng)域,高效處理大規(guī)模稀疏矩陣運算是提升整體計算效能的關(guān)鍵。為此,我們炎核開源開放平臺上架推出 OpenSparseBlas——一個專為稀疏矩陣/向量計算而打造的高性能
    的頭像 發(fā)表于 12-15 15:18 ?631次閱讀

    NVIDIA DGX Spark平臺上對NVIDIA ConnectX-7 200G網(wǎng)卡配置教程

    NVIDIA DGX Spark 平臺上對 NVIDIA ConnectX-7 200G 網(wǎng)卡進行配置時,會遇到“4 個邏輯端口”現(xiàn)象。理解背后的真相是后續(xù)所有配置的基礎(chǔ)。本文將從此現(xiàn)象入手,逐步解析其原理,并提供從基礎(chǔ)配置到深度
    的頭像 發(fā)表于 11-21 09:19 ?5348次閱讀
    <b class='flag-5'>在</b>NVIDIA DGX Spark<b class='flag-5'>平臺上</b>對NVIDIA ConnectX-7 200G網(wǎng)卡配置教程

    如何把蜂鳥E203的核移植N4DDR平臺上

    請問一下我想把蜂鳥E203的核移植N4DDR平臺上,但是他們的約束文件及硬件電路區(qū)別很大,具體我該怎么修改呢?比如蜂鳥的核中只有4個撥碼開關(guān)而N4DDR上有16個撥碼開關(guān)。
    發(fā)表于 11-10 06:46

    【Milk-V Duo S 開發(fā)板免費體驗】Milk-V DuoS性能測試

    ,因為是WSL下執(zhí)行coremark的err,WSL是X86,交叉編譯出來的持續(xù)是AARCH64的,必須不能運行嘛~ 看看文件: ~/duo-examples/coremark$ file
    發(fā)表于 08-09 23:32

    【Milk-V Duo S 開發(fā)板免費體驗】測試舵機

    executable, ARM aarch64, version 1 (SYSV), dynamically linked, interpreter /lib/ld-linux-aarch64
    發(fā)表于 08-09 22:46

    【HZ-T536開發(fā)板免費體驗】3 - Cangjie Magic調(diào)用視覺語言大模型(VLM)真香,是不是可以沒有YOLO和OCR了?

    ,缺少對嵌入式開發(fā)板的測試。本文主要討論AARCH64的Linux平臺,這個也是目前嵌入式開發(fā)板中最多的平臺之一。 我們使用的是交叉編譯,雖然T536開發(fā)板的能力很強,本地編譯也可以
    發(fā)表于 08-01 22:15

    【HZ-RK3568開發(fā)板免費體驗】3、開啟Linux Kernel RT功能

    =../prebuilts/gcc/linux-x86/aarch64/gcc-arm-10.3-2021.07-x86_64-aarch64-none-linux-gnu/bin
    發(fā)表于 07-22 14:03

    【HZ-T536開發(fā)板免費體驗】2 - 交叉編譯倉頡編程語言程序到開發(fā)板運行

    /aarch64-linux-gnu/lib/libstdc++.so 程序運行 將程序拷貝到板子運行,得到如下結(jié)果: 運行結(jié)果正確。和0.53版本比較,1.0版本的static選項比較好,分發(fā)程序變得很容易。 結(jié)束語
    發(fā)表于 07-16 21:27

    【HZ-T536開發(fā)板免費體驗】1 - 開箱測試

    這樣的大模型了。 開機測試 開機啟動后,可以看到相同是 Ubuntu 22.04.5 LTS (GNU/Linux 5.10.198 aarch64),不過不是桌面版本,所以如果直接將HDMI插入顯示器
    發(fā)表于 07-16 19:41

    【HZ-RK3568開發(fā)板免費體驗】合眾HZ-RK3568開發(fā)環(huán)境搭建

    /gcc-linaro-7.5.0-2019.12-x86_64_aarch64-linux-gnu/bin 保存退出 3.運行 source ~/.bashrc 讓文件生效 $ source ~/.bashrc 交叉編譯器驗證 方法一:命令行下
    發(fā)表于 07-15 23:13

    ArkUI-X平臺差異化

    : 1.自身業(yè)務(wù)邏輯不同平臺本來就有差異; 2.OpenHarmony上調(diào)用了不支持跨平臺的API,這就需要在OpenHarmony仍然調(diào)用對應(yīng)API,其他
    發(fā)表于 06-10 23:08

    能在Meteor Lake平臺上使用SDK 3.5嗎?

    SDK 是 3.6 版,不支持 CYPD6127 部件。 那么,我能在 Meteor Lake 平臺上使用 SDK 3.5 嗎?
    發(fā)表于 05-26 08:01

    可以手動構(gòu)建imx-gpu-viv嗎?

    我是新手,希望能得到任何支持。 我目前正在使用內(nèi)核 5.15 和 Yocto 4.0 (kirkstone)。我明白我必須為我的 aarch64
    發(fā)表于 03-28 06:35

    stm32F407平臺上使用freertos,使用pvPortMalloc申請內(nèi)存,發(fā)現(xiàn)內(nèi)存中的數(shù)據(jù)總被修改,怎么解決?

    如題,我現(xiàn)在在stm32F407平臺上打開FREERTOS,然后使用pvPortMalloc動態(tài)申請內(nèi)存的時候,發(fā)現(xiàn)這塊內(nèi)存中的數(shù)據(jù)總是變化,后面改為malloc申請,內(nèi)存中的數(shù)據(jù)就符合預(yù)期了,我已經(jīng)按照網(wǎng)上的流程配置了freertos,不知道是什么原因?qū)е逻@種現(xiàn)象?
    發(fā)表于 03-07 09:03