什么是內(nèi)存泄漏:
程序向系統(tǒng)申請內(nèi)存,使用完不需要之后,不釋放內(nèi)存還給系統(tǒng)回收,造成申請的內(nèi)存被浪費(fèi).
發(fā)現(xiàn)系統(tǒng)中內(nèi)存使用量隨著時(shí)間的流逝,消耗的越來越多,例如下圖所示:

接下來的排查思路是:
1.監(jiān)控系統(tǒng)中每個(gè)用戶進(jìn)程消耗的PSS (使用pmap工具(pmap pid)).
PSS:按比例報(bào)告的物理內(nèi)存,比如進(jìn)程A占用20M物理內(nèi)存,進(jìn)程B和進(jìn)程A共享5M物理內(nèi)存,那么進(jìn)程A的PSS就是(20 - 5) + 5/2 = 17.5M
2.監(jiān)控/proc/meminfo輸出,重點(diǎn)觀察Slab使用量和slab對應(yīng)的/proc/slabinfo信息
3.參考/proc/meminfo輸出,計(jì)算系統(tǒng)中未被統(tǒng)計(jì)的內(nèi)存變化,比如內(nèi)核驅(qū)動(dòng)代碼
直接調(diào)用alloc_page()從buddy中拿走的內(nèi)存不會(huì)被單獨(dú)統(tǒng)計(jì)
以上排查思路分別對應(yīng)下圖中的1,2,3 :

在排查的過程中發(fā)現(xiàn)系統(tǒng)非常空閑,都沒有跑任何用戶業(yè)務(wù)進(jìn)程。
其中在使用slabtop監(jiān)控slab的使用情況時(shí)發(fā)現(xiàn)size-4096 不停增長

通過監(jiān)控/proc/slabinfo也發(fā)現(xiàn)SReclaimable 的使用量不停增長
while true; do sleep 1 ; cat /proc/slabinfo >> /tmp/slabinfo.txt ; echo "===" >> /tmp/slabinfo.txt ; done
由此判斷很可能是內(nèi)核空間在使用size-4096 時(shí)發(fā)生了內(nèi)存泄漏.
接下來使用trace event(tracepoint)功能來監(jiān)控size-4096的使用和釋放過程,
主要用來跟蹤kmalloc()和kfree()函數(shù)對應(yīng)的trace event, 因?yàn)樗麄兊膖race event被觸發(fā)之后會(huì)打印kmalloc()和kfree()所申請和釋放的內(nèi)存地址,然后進(jìn)一步只過濾申請4096字節(jié)的情況。
#trace-cmd record -e kmalloc -f 'bytes_alloc==4096' -e kfree -T
(-T 打印堆棧)
等待幾分鐘之后…
#ctrl ^c 中斷trace-cmd
#trace-cmd report
以上步驟相當(dāng)于:

等待幾分鐘之后…
#cp /sys/kernel/debug/tracing/trace_pipe /tmp/kmalloc-trace
從trace-cmd report的輸出結(jié)果來看,很多kmalloc 對應(yīng)的ptr值都沒有kfree與之對應(yīng)的ptr值

這就說明了cat進(jìn)程在內(nèi)核空間使用size-4096之后并沒有釋放,造成了內(nèi)存泄漏。
為了進(jìn)一步精確定位到是使用哪個(gè)內(nèi)核函數(shù)造成的問題,此時(shí)手動(dòng)觸發(fā)vmcore
#echo c > /proc/sysrq-trigger
然后使用crash工具分析vmcore:
#crash ./vmcore ./vmlinux.debug
讀出上面kmalloc申請的ptr內(nèi)存信息

(讀取0xffff880423744000內(nèi)存開始的4096個(gè)字節(jié),并以字符形式顯示)

發(fā)現(xiàn)從上面幾個(gè)ptr內(nèi)存中讀出的內(nèi)容都是非常相似,仔細(xì)看一下發(fā)現(xiàn)都是/proc/schedstat 的輸出內(nèi)容。
通過閱讀相關(guān)代碼發(fā)現(xiàn),當(dāng)讀出/proc/schedstat內(nèi)容之后,確實(shí)沒有釋放內(nèi)存

然后發(fā)現(xiàn)kernel上游已經(jīng)有patch解決了這個(gè)問題:
commit: 8e0bcc722289
fix a leak in /proc/schedstats
原文標(biāo)題:一次解決Linux內(nèi)核內(nèi)存泄漏實(shí)戰(zhàn)全過程
文章出處:【微信公眾號(hào):Linuxer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
內(nèi)核
+關(guān)注
關(guān)注
4文章
1467瀏覽量
42869 -
Linux
+關(guān)注
關(guān)注
88文章
11758瀏覽量
219004
原文標(biāo)題:一次解決Linux內(nèi)核內(nèi)存泄漏實(shí)戰(zhàn)全過程
文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
Linux內(nèi)核伙伴系統(tǒng)內(nèi)存申請函數(shù)詳解:從原理到實(shí)戰(zhàn)
Linux系統(tǒng)內(nèi)核參數(shù)調(diào)優(yōu)實(shí)戰(zhàn)指南
【「Linux 設(shè)備驅(qū)動(dòng)開發(fā)(第 2 版)」閱讀體驗(yàn)】+讀深入理解Linux內(nèi)核內(nèi)存分配
rk基于linux/android內(nèi)存管理
使用單片機(jī)系統(tǒng)時(shí)間不準(zhǔn)怎么辦?
at_device 包 ml307長時(shí)間運(yùn)行有內(nèi)存泄漏問題怎么解決?
在OpenVINO? C++代碼中啟用 AddressSanitizer 時(shí)的內(nèi)存泄漏怎么解決?
如何配置和驗(yàn)證Linux內(nèi)核參數(shù)
FPGA的Jtag接口燒了,怎么辦?
樹莓派4 性能大比拼:標(biāo)準(zhǔn)Linux與實(shí)時(shí)Linux 4.19內(nèi)核的延遲測試
Linux內(nèi)核內(nèi)存泄漏怎么辦?
評(píng)論