本文將分享基于A-Ops性能熱點(diǎn)火焰圖進(jìn)行性能診斷的2個(gè)實(shí)際案例,介紹如何使用火焰圖快速定位系統(tǒng)或者應(yīng)用的性能問題,加深大家對(duì)A-Ops火焰圖特性的理解。
案例1
云原生場(chǎng)景下Java類應(yīng)用性能問題診斷
1. 場(chǎng)景及案例介紹
某Kafka producer客戶端Java應(yīng)用版本升級(jí)后性能出現(xiàn)下降,性能從222W TPS下降到65W TPS,吞吐量從337MB/s下降到95.9MB/s,如下圖所示(為了便于比較,在不同POD里同時(shí)啟動(dòng)升級(jí)前后的兩個(gè)應(yīng)用):

可見,Kafka 客戶端應(yīng)用的性能出現(xiàn)了明顯的下降,但此時(shí)Kafka服務(wù)端較輕載,CPU 0.7%,內(nèi)存16.8%,說明性能劣化是由于客戶端應(yīng)用的問題導(dǎo)致。Kafka服務(wù)端資源情況如下:

2.性能問題診斷
通過升級(jí)前后的火焰圖比較可以看出,升級(jí)后的CPU性能主要消耗在字符串format處理函數(shù)上。對(duì)于Kafka生成端應(yīng)用,一般存在大量字符串操作,而字符串處理函數(shù)format性能較低,與StringBuilder方法相比有幾倍甚至幾十倍的性能差距,可見字符串format函數(shù)是導(dǎo)致性能降低的主要原因。

案例2
CPU抖動(dòng)類性能故障診斷案例
1. 場(chǎng)景及案例介紹
在生產(chǎn)環(huán)境中經(jīng)常會(huì)遇到一些偶發(fā)性的CPU抖動(dòng)問題,這會(huì)對(duì)應(yīng)用的性能造成一定的影響,但由于沒有必然的規(guī)律,故障發(fā)現(xiàn)及問題定位比較難。
2.性能問題診斷
為了模擬上述偶發(fā)性的故障,我們通過iperf打流注入2分鐘的故障,然后從多個(gè)角度分析故障注入前后火焰圖的數(shù)據(jù),進(jìn)而對(duì)CPU抖動(dòng)類性能故障進(jìn)行診斷。
在1038通過 iperf3注入2分鐘的流量,命令如下:
iperf3 -c 192.168.122.115 -p 5201 -i 10 -t 120 -P 100 -N -M 100 -b 10000M
流量注入前后,系統(tǒng)應(yīng)用指標(biāo)及火焰圖如下圖所示:

從上圖可見,流量注入期間,CPU使用率從平均22%升高到33%,應(yīng)用性能從232w tps下降到215w tps,火焰圖中iperf3進(jìn)程對(duì)CPU的占用為8.96%。
我們可以通過火焰圖比較視圖進(jìn)一步分析這個(gè)問題,下圖左邊的火焰圖是注入故障前的火焰圖,右邊為注入故障期間的火焰圖,對(duì)比可以看到故障注入期間多個(gè)iperf3這個(gè)進(jìn)程。

另外,我們還可以通過火焰圖diff視圖來分析這個(gè)問題,參考下圖,火焰圖紅色部分為故障注入期間新增加的進(jìn)程,進(jìn)而可以定位到iperf3是造成這次CPU抖動(dòng)以及應(yīng)用性能劣化的根因。

通過A-Ops性能熱點(diǎn)火焰圖,開發(fā)者和維護(hù)者可以很方便地預(yù)測(cè)潛在問題和定位已發(fā)生問題。
安裝A-Ops性能熱點(diǎn)火焰圖
gala-ops是針對(duì)云基礎(chǔ)設(shè)施灰度故障的應(yīng)用級(jí)/系統(tǒng)級(jí)在線診斷工具,火焰圖探針stackprobe集成在其中的gala-gopher組件內(nèi),用戶只需一鍵安裝gala-gopher后,在配置文件中開啟或關(guān)閉火焰圖探針即可使用。
審核編輯:劉清
-
JAVA
+關(guān)注
關(guān)注
20文章
3004瀏覽量
116752 -
TPS
+關(guān)注
關(guān)注
0文章
85瀏覽量
37571 -
POD
+關(guān)注
關(guān)注
0文章
18瀏覽量
6302
原文標(biāo)題:案例介紹:使用A-Ops性能熱點(diǎn)火焰圖進(jìn)行性能診斷
文章出處:【微信號(hào):openEulercommunity,微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
新品 | 性能全覆蓋!視美泰發(fā)布三款OPS:高端旗艦OPS-3588A、中端OPS-3399E及高性價(jià)比OPS-3288E
《OPS電腦:國產(chǎn)插拔式電腦的超強(qiáng)功能》
火焰傳感器的特征及應(yīng)用
火焰探測(cè)器參考方案
三波段紅外火焰探測(cè)器參考設(shè)計(jì)
火焰識(shí)別
基于多特征量對(duì)數(shù)回歸模型的火焰快速識(shí)別算法
火焰圖:全局視野的Linux性能剖析
招商銀行和歐拉開源社區(qū)聯(lián)創(chuàng)A-Ops智能運(yùn)維項(xiàng)目并完成測(cè)試
OPS常見問題的故障定位思路
信創(chuàng)OPS電腦:賦能智慧教室快速發(fā)展
使用Arthas火焰圖工具的Java應(yīng)用性能分析和優(yōu)化經(jīng)驗(yàn)
OPS 電腦十大品牌商家
如何使用A-Ops火焰圖快速定位系統(tǒng)或者應(yīng)用的性能問題
評(píng)論