平常我們使用 top 命令來(lái)查看系統(tǒng)的性能情況,在 top 命令中可以看到很多不同類型的 CPU 使用率,如下圖紅框中標(biāo)出部分:
下面,我們來(lái)介紹一下這些 CPU 使用率的意義:
us:user time,表示 CPU 執(zhí)行用戶進(jìn)程的時(shí)間,包括 nice 時(shí)間。通常都是希望用戶空間CPU越高越好。
sy:system time,表示 CPU 在內(nèi)核運(yùn)行的時(shí)間,包括 IRQ 和 softirq。系統(tǒng) CPU 占用越高,表明系統(tǒng)某部分存在瓶頸。通常這個(gè)值越低越好。
ni:nice time,具有優(yōu)先級(jí)的用戶進(jìn)程執(zhí)行時(shí)占用的 CPU 利用率百分比。
id:idle time,表示系統(tǒng)處于空閑期,等待進(jìn)程運(yùn)行。
wa:waiting time,表示 CPU 在等待 IO 操作完成所花費(fèi)的時(shí)間。系統(tǒng)不應(yīng)該花費(fèi)大量的時(shí)間來(lái)等待 IO 操作,否則就說(shuō)明 IO 存在瓶頸。
hi:hard IRQ time,表示系統(tǒng)處理硬中斷所花費(fèi)的時(shí)間。
si:soft IRQ time,表示系統(tǒng)處理軟中斷所花費(fèi)的時(shí)間。
st:steal time,被強(qiáng)制等待(involuntary wait)虛擬 CPU 的時(shí)間,此時(shí) Hypervisor 在為另一個(gè)虛擬處理器服務(wù)。
當(dāng)然,單靠上面的解釋來(lái)理解它們的意義還是比較困難的。所以,本文主要從源碼的角度來(lái)分析它們到底代表什么。
時(shí)鐘中斷首先,我們要知道統(tǒng)計(jì) CPU 使用情況在什么地方執(zhí)行的。在分析之前,我們先來(lái)了解下 時(shí)鐘中斷:
時(shí)鐘中斷:是一種硬中斷,由時(shí)間硬件(系統(tǒng)定時(shí)器,一種可編程硬件)產(chǎn)生。當(dāng) CPU 接收到時(shí)鐘中斷信號(hào)后,會(huì)在處理完當(dāng)前指令后調(diào)用 時(shí)鐘中斷處理程序 來(lái)完成更新系統(tǒng)時(shí)間、執(zhí)行周期性任務(wù)等。
可以發(fā)現(xiàn),統(tǒng)計(jì) CPU 使用情況是在 時(shí)鐘中斷處理程序 中完成的。
每個(gè) CPU 的使用情況通過(guò) cpu_usage_stat 結(jié)構(gòu)來(lái)記錄,我們來(lái)看看其定義:
struct cpu_usage_stat {
cputime64_t user;
cputime64_t nice;
cputime64_t system;
cputime64_t softirq;
cputime64_t irq;
cputime64_t idle;
cputime64_t iowait;
cputime64_t steal;
cputime64_t guest;
};
從 cpu_usage_stat 結(jié)構(gòu)的定義可以看出,其每個(gè)字段與 top 命令的 CPU 使用率類型一一對(duì)應(yīng)。在內(nèi)核初始化時(shí),會(huì)為每個(gè) CPU 創(chuàng)建一個(gè) cpu_usage_stat 結(jié)構(gòu),用于統(tǒng)計(jì) CPU 的使用情況。
OK,現(xiàn)在我們來(lái)分析下內(nèi)核是怎么統(tǒng)計(jì) CPU 的使用情況的。
每次執(zhí)行 時(shí)鐘中斷處理程序 都會(huì)調(diào)用 account_process_tick 函數(shù)進(jìn)行 CPU 使用情況統(tǒng)計(jì),我們來(lái)分析一下 account_process_tick 函數(shù)的實(shí)現(xiàn):
void account_process_tick(struct task_struct *p, int user_tick)
{
cputime_t one_jiffy_scaled = cputime_to_scaled(cputime_one_jiffy);
struct rq *rq = this_rq();
// 說(shuō)明:user_tick 變量標(biāo)識(shí)當(dāng)前是否處于執(zhí)行用戶應(yīng)用程序
if (user_tick) {
// 1. 如果 CPU 在執(zhí)行用戶程序, 那么調(diào)用 account_user_time 進(jìn)行統(tǒng)計(jì)
account_user_time(p, cputime_one_jiffy, one_jiffy_scaled);
} else if ((p != rq-》idle) || (irq_count() != HARDIRQ_OFFSET)) {
// 2. 如果 CPU 在執(zhí)行內(nèi)核代碼, 那么調(diào)用 account_system_time 進(jìn)行統(tǒng)計(jì)
account_system_time(p, HARDIRQ_OFFSET, cputime_one_jiffy,
one_jiffy_scaled);
} else {
// 3. 否則說(shuō)明 CPU 在執(zhí)行 idle 進(jìn)程(也就是處于空閑狀態(tài)), 那么調(diào)用 account_idle_time 進(jìn)行統(tǒng)計(jì)
account_idle_time(cputime_one_jiffy);
}
}
account_process_tick 函數(shù)主要分 3 種情況進(jìn)行統(tǒng)計(jì),如下:
如果 CPU 在執(zhí)行用戶程序,那么調(diào)用 account_user_time 進(jìn)行統(tǒng)計(jì)。
如果 CPU 在執(zhí)行內(nèi)核代碼,那么調(diào)用 account_system_time 進(jìn)行統(tǒng)計(jì)。
否則說(shuō)明 CPU 在執(zhí)行 idle 進(jìn)程(也就是處于空閑狀態(tài)),那么調(diào)用 account_idle_time 進(jìn)行統(tǒng)計(jì)。
CPU 使用情況統(tǒng)計(jì)下面我們分別對(duì)這 3 種統(tǒng)計(jì)進(jìn)行分析。
1. 統(tǒng)計(jì)用戶程序執(zhí)行時(shí)間
統(tǒng)計(jì)用戶程序的執(zhí)行時(shí)間是通過(guò) account_user_time 函數(shù)來(lái)完成的,我們來(lái)看看其實(shí)現(xiàn):
void account_user_time(struct task_struct *p, cputime_t cputime,
cputime_t cputime_scaled)
{
// 獲取 CPU 的統(tǒng)計(jì)結(jié)構(gòu)(每個(gè)CPU一個(gè) cpu_usage_stat 結(jié)構(gòu))
struct cpu_usage_stat *cpustat = &kstat_this_cpu.cpustat;
cputime64_t tmp;
。..
// 分 2 種情況統(tǒng)計(jì) CPU 的使用情況
// 1. 如果進(jìn)程的 nice 值大于0, 那么將會(huì)統(tǒng)計(jì)到 nice 字段中
// 2. 如果進(jìn)程的 nice 值小于等于0, 那么將會(huì)統(tǒng)計(jì)到 user 字段中
if (TASK_NICE(p) 》 0)
cpustat-》nice = cputime64_add(cpustat-》nice, tmp);
else
cpustat-》user = cputime64_add(cpustat-》user, tmp);
。..
}
account_user_time 函數(shù)主要分兩種情況統(tǒng)計(jì):
如果進(jìn)程的 nice 值大于0,那么將會(huì)增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 nice 字段中。
如果進(jìn)程的 nice 值小于等于0,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 user 字段中。
這里說(shuō)明一下進(jìn)程 nice 值的作用,nice 值越大,說(shuō)明進(jìn)程的優(yōu)先級(jí)越低。所以,nice 統(tǒng)計(jì)值主要用來(lái)統(tǒng)計(jì)低優(yōu)先級(jí)進(jìn)程的占使用 CPU 的情況。也說(shuō)明了,user 和 nice 統(tǒng)計(jì)值都屬于執(zhí)行用戶程序的 CPU 時(shí)間。
2. 統(tǒng)計(jì)內(nèi)核代碼執(zhí)行時(shí)間
如果在發(fā)生時(shí)鐘中斷前,CPU 處于內(nèi)核態(tài),也就是說(shuō)在執(zhí)行內(nèi)核代碼。那么將會(huì)調(diào)用 account_system_time 函數(shù)進(jìn)行統(tǒng)計(jì),account_system_time 函數(shù)實(shí)現(xiàn)如下:
void account_system_time(struct task_struct *p, int hardirq_offset,
cputime_t cputime, cputime_t cputime_scaled)
{
// 獲取 CPU 的統(tǒng)計(jì)結(jié)構(gòu)(每個(gè)CPU一個(gè) cpu_usage_stat 結(jié)構(gòu))
struct cpu_usage_stat *cpustat = &kstat_this_cpu.cpustat;
cputime64_t tmp;
。..
// 主要分 3 種情況進(jìn)行統(tǒng)計(jì)
// 1. 如果當(dāng)前處于硬中斷執(zhí)行上下文, 那么統(tǒng)計(jì)到 irq 字段中
// 2. 如果當(dāng)前處于軟中斷執(zhí)行上下文, 那么統(tǒng)計(jì)到 softirq 字段中
// 3. 否則統(tǒng)計(jì)到 system 字段中
if (hardirq_count() - hardirq_offset)
cpustat-》irq = cputime64_add(cpustat-》irq, tmp);
else if (softirq_count())
cpustat-》softirq = cputime64_add(cpustat-》softirq, tmp);
else
cpustat-》system = cputime64_add(cpustat-》system, tmp);
。..
}
account_system_time 函數(shù)主要分 3 種情況進(jìn)行統(tǒng)計(jì):
如果當(dāng)前處于硬中斷執(zhí)行上下文,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 irq 字段中。
如果當(dāng)前處于軟中斷執(zhí)行上下文,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 softirq 字段中。
否則增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 system 字段中。
從上面代碼可以看出,irq 和 softirq 統(tǒng)計(jì)值也算是內(nèi)核代碼執(zhí)行時(shí)間。
3. idle 進(jìn)程執(zhí)行時(shí)間統(tǒng)計(jì)
當(dāng)系統(tǒng)中沒(méi)有可運(yùn)行的進(jìn)程時(shí),將會(huì)執(zhí)行 idle 進(jìn)程。也就是說(shuō),當(dāng)系統(tǒng)執(zhí)行 idle 進(jìn)程時(shí),表示系統(tǒng)正處于空閑狀態(tài)。
idle 進(jìn)程執(zhí)行時(shí)間統(tǒng)計(jì)由 account_idle_time 函數(shù)完成,其實(shí)現(xiàn)如下:
void account_idle_time(cputime_t cputime)
{
struct cpu_usage_stat *cpustat = &kstat_this_cpu.cpustat;
cputime64_t cputime64 = cputime_to_cputime64(cputime);
struct rq *rq = this_rq();
// 分 2 種情況統(tǒng)計(jì) CPU 的使用情況
// 1. 如果系統(tǒng)有進(jìn)程正在等待 I/O 操作完成, 那么將統(tǒng)計(jì)到 iowait 字段中
// 2. 否則將統(tǒng)計(jì)到 idle 字段中
if (atomic_read(&rq-》nr_iowait) 》 0)
cpustat-》iowait = cputime64_add(cpustat-》iowait, cputime64);
else
cpustat-》idle = cputime64_add(cpustat-》idle, cputime64);
}
account_idle_time 函數(shù)也分兩種情況進(jìn)行統(tǒng)計(jì):
如果系統(tǒng)中有正在等待 I/O 操作完成的進(jìn)程,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 iowait 字段中。
否則增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 idle 字段中。
從上面的分析可以看出,iowait 統(tǒng)計(jì)值也屬于空閑時(shí)間的一種。
top 命令的 CPU 使用率通過(guò)源碼分析,我們知道 top 命令中 CPU 使用率各種類型的意思,現(xiàn)在我們來(lái)介紹一下 top 命令是怎么計(jì)算各種類型的 CPU 使用率。
要獲取各個(gè) CPU 的使用情況信息,可以通過(guò)讀取 /proc/stat 文件獲取,如下:
[vagrant@localhost ~]$ cat /proc/stat
cpu 245 10 1142 1097923 95 0 28 0 0 0
cpu0 245 10 1142 1097923 95 0 28 0 0 0
。..
上面的結(jié)果顯示了 CPU 的使用情況信息,第一行代表所有 CPU 的總和,而第二行開(kāi)始表示每個(gè) CPU 核心的使用情況信息。因?yàn)槲业?a href="http://www.3532n.com/v/tag/1247/" target="_blank">電腦只有一個(gè)核,所以只有一條數(shù)據(jù)。
下面說(shuō)說(shuō)這些數(shù)據(jù)的意義,從第一個(gè)數(shù)值開(kāi)始分別代表:user ,nice,system,idle,iowait, irq,softirq,steal。
所以,top 命令的 CPU 使用率計(jì)算公式如下:
CPU總時(shí)間 = user + nice + system + idle + wait + irq + softirq + steal
%us = user / CPU總時(shí)間
%ni = nice / CPU總時(shí)間
%sy = system / CPU總時(shí)間
%id = idel / CPU總時(shí)間
%wa = wait / CPU總時(shí)間
%hi = irq / CPU總時(shí)間
%si = softirq / CPU總時(shí)間
%st = steal / CPU總時(shí)間
嗯,看起來(lái)還是挺簡(jiǎn)單的。
總結(jié)本文主要分析了 top 命令中的 CPU 使用率的意義和實(shí)現(xiàn)原理,希望通過(guò)本文,能夠幫助大家對(duì) top 命令有更深的認(rèn)識(shí)。
責(zé)任編輯:haq
-
cpu
+關(guān)注
關(guān)注
68文章
11277瀏覽量
224956 -
命令
+關(guān)注
關(guān)注
5文章
755瀏覽量
23751 -
TOP
+關(guān)注
關(guān)注
0文章
37瀏覽量
33238
原文標(biāo)題:聊聊 top 命令中的 CPU 使用率
文章出處:【微信號(hào):gh_3980db2283cd,微信公眾號(hào):開(kāi)關(guān)電源芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
MOSFET 失效 Top 原因
modelsim跑tb_top.v報(bào)fatal是什么原因?qū)е碌模咳绾谓鉀Q?
飛凌嵌入式ElfBoard-Linux系統(tǒng)基礎(chǔ)入門(mén)-其它shell命令
Nginx高并發(fā)場(chǎng)景下的性能調(diào)優(yōu)技巧
Linux基礎(chǔ)命令which詳解
一文掌握Linux命令
詳解Linux網(wǎng)絡(luò)管理中的關(guān)鍵命令
飛凌嵌入式ElfBoard ELF 1板卡-文件系統(tǒng)常用命令之磁盤(pán)管理與維護(hù)常用命令
allegro軟件走線命令下參數(shù)不顯示如何解決
用于攝像頭模塊的 Open Top QFN 插槽Ironwood Electronics
國(guó)產(chǎn)電腦CPU性能排行榜TOP7:CPU緩存/主頻/多核實(shí)測(cè)數(shù)據(jù)分析
5個(gè)Linux性能監(jiān)控命令
在MR-VMU-RT1176上運(yùn)行的PX4飛行控制軟件的負(fù)載(大約)是多少?
服務(wù)器使用過(guò)程中卡頓如何排查
TECS OpenStack資源池主機(jī)磁盤(pán)分區(qū)使用率過(guò)高的問(wèn)題處理
top命令中CPU使用率的意義
評(píng)論