數(shù)據(jù)庫場景下,由于操作系統(tǒng)某些進程操作(比如磁盤、網(wǎng)絡(luò)等)占用I/O帶寬過高,造成應(yīng)用因為I/O帶寬不足產(chǎn)生性能劣化的問題,如何快速、準確地診斷應(yīng)用性能問題,并對問題進行定界定位是運維人員的重要挑戰(zhàn)。
案例一
GaussDB應(yīng)用磁盤IO類故障在線診斷
該案例通過對Gaussdb應(yīng)用注入磁盤IO故障來模擬。
1
故障注入前
應(yīng)用實時拓撲關(guān)系如下圖所示,gaussdb應(yīng)用包含1個master(進程id:1548)和1個slaver(進程id:1739),運行在虛擬機vm02上,gaussdb master有5個客戶端TCP連接。

此時,gaussdb的應(yīng)用性能如下圖所示,平均600 TPS。

2
注入故障
在gaussdb的數(shù)據(jù)目錄注入磁盤讀寫故障,命令如下:blade create disk burn --read --write --path /data --timeout 120

3
應(yīng)用性能診斷
此時應(yīng)用性能出現(xiàn)劣化,從大概600 TPS → 60 TPS,下降了近10倍,如下圖所示:

故障發(fā)現(xiàn)與定位結(jié)果如下圖所示,可以看出已產(chǎn)生應(yīng)用性能劣化事件,原因是磁盤讀寫響應(yīng)異常。

具體的故障傳播關(guān)系如下圖所示,可見應(yīng)用性能劣化是因為磁盤寫響應(yīng)異常以及block層request時延異常,進一步的磁盤類異常是由于故障注入工具chaos(進程id:3941335)導(dǎo)致。

案例二
Redis應(yīng)用網(wǎng)絡(luò)時延類故障在線診斷
1
注入故障
通過故障注入工具ChaosBlade注入2分鐘網(wǎng)絡(luò)時延故障,具體命令:blade create network delay --time 50 --offset 50 --interface ens1 --local-port 3742 --timeout 120

故障注入期間redis sli指標出現(xiàn)明顯劣化,大概從10ms → 80ms
2
應(yīng)用性能診斷
故障發(fā)現(xiàn)與定位結(jié)果如下圖所示,可以看出已產(chǎn)生應(yīng)用性能劣化事件,原因是網(wǎng)絡(luò)時延異常。


具體的故障傳播關(guān)系如下圖所示,可見應(yīng)用性能劣化是因為網(wǎng)絡(luò)時延異常導(dǎo)致。

審核編輯 :李倩
-
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
7402瀏覽量
129288 -
磁盤
+關(guān)注
關(guān)注
1文章
398瀏覽量
26473 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
4020瀏覽量
68340
原文標題:A-Ops 數(shù)據(jù)庫場景在線應(yīng)用性能診斷案例
文章出處:【微信號:openEulercommunity,微信公眾號:openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
華納云為游戲數(shù)據(jù)庫選擇高性能NVMe SSD存儲
數(shù)據(jù)庫性能瓶頸分析與SQL優(yōu)化實戰(zhàn)案例
數(shù)據(jù)庫性能優(yōu)化指南
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫故障的數(shù)據(jù)恢復(fù)案例
三款主流國產(chǎn)數(shù)據(jù)庫的技術(shù)特點
milvus向量數(shù)據(jù)庫的主要特性和應(yīng)用場景
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫文件丟失的數(shù)據(jù)恢復(fù)案例
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫被加密如何恢復(fù)數(shù)據(jù)?
oracle數(shù)據(jù)恢復(fù)—oracle數(shù)據(jù)庫誤執(zhí)行錯誤truncate命令如何恢復(fù)數(shù)據(jù)?
MySQL數(shù)據(jù)庫采集網(wǎng)關(guān)是什么?有什么功能?
SQLSERVER數(shù)據(jù)庫是什么
新品 | 性能全覆蓋!視美泰發(fā)布三款OPS:高端旗艦OPS-3588A、中端OPS-3399E及高性價比OPS-3288E
MySQL數(shù)據(jù)庫是什么
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)——MongoDB數(shù)據(jù)庫文件拷貝后服務(wù)無法啟動的數(shù)據(jù)恢復(fù)
A-Ops數(shù)據(jù)庫場景在線應(yīng)用性能診斷案例
評論