琢磨了好幾天,也不知道公眾號第一篇正式文章應(yīng)該怎么寫。現(xiàn)在很后悔在朋友圈高調(diào)公開公眾號,還竟敢宣稱有15年行業(yè)經(jīng)驗,大家不要信以為真,其實不過是一年經(jīng)驗重復(fù)了十幾年而已。連知乎的小朋友都知道問問題的正確姿勢,我真是有些汗顏。
言歸正狀,萬事開頭難,現(xiàn)在騎虎難下,也只好勉力為之。在這里想先介紹些今后文章經(jīng)常會涉及的一些指標(biāo)概念,希望能達(dá)成基本的共識,到時候交流起來會方便些。
Lateny和Throughput
1 延遲(latency),完成一個任務(wù)所需要的時間。
2.吞吐量(throughput),單位時間完成的任務(wù)量。
體系結(jié)構(gòu)大神David.A.Patterson在他的著作《計算機(jī)組成和設(shè)計》用洗衣過程來做譬喻。洗衣過程由清洗,烘干,折疊,收納四個環(huán)節(jié)組成,每個環(huán)節(jié)耗時30分鐘,所以每次洗衣任務(wù)的latency是2個小時,沒有優(yōu)化以前,8個小時的完成4次洗衣任務(wù),所以throughput只有0.5。

經(jīng)過流水線改造以后,效率得到改善,雖然每次洗衣還是花費2小時,但單位時間完成的任務(wù)量大大提升,4次洗衣任務(wù)只花了3.5個小時。

我們可以把生活常識映射到處理器的流水線(Pipeline)設(shè)計,處理器的指令Pipeline通過實現(xiàn)指令級的并行(Instruction Level Parallelism)來提高throughput。這種ILP的優(yōu)化對碼農(nóng)們就是免費的午餐,躺著程序性能就上去了。

另外,如下圖,我們也可以通過多核CPU或者內(nèi)置很多計算單元的GPU來提高程序整體的性能(throughput),這種優(yōu)化屬于線程級并行(Thread Level Parallelism)。相比ILP,TLP對碼農(nóng)不太友好,不再供應(yīng)免費的午餐,我們需要編寫多線程程序,甚至通過專門的接口(CUDA/OpenCL)讓CPU/GPU忙碌起來,才能得到性能的提升。
第一篇先寫到這兒了,再長就沒人看了,接下來會介紹其它幾個重要概念。
編輯:lyn
-
處理器
+關(guān)注
關(guān)注
68文章
20255瀏覽量
252344 -
cpu
+關(guān)注
關(guān)注
68文章
11279瀏覽量
225025 -
吞吐量
+關(guān)注
關(guān)注
0文章
49瀏覽量
12678 -
延遲
+關(guān)注
關(guān)注
1文章
74瀏覽量
13961
原文標(biāo)題:GPU: 衡量計算效能的正確姿勢(1)
文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
STPMC1可編程多相電能計算器IC:設(shè)計與應(yīng)用詳解
炎核開源開放平臺上架推出OpenSparseBlas高性能稀疏計算庫
汽車中的GPU是如何使用的?
絕緣子漏電起痕試驗儀泄漏電流信號的小波變換分析及電弧能量計算
aicube的n卡gpu索引該如何添加?
如何選擇合適的電池電量計
如何計算孔板流量計和平衡流量計的流量?計算公式一樣嗎?
GPU架構(gòu)深度解析
Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)
變壓器速查速算手冊(完整版)
常見傳動機(jī)構(gòu)負(fù)載慣量計算方法及實例
淺談電磁流量計的常見故障及排除方法
如何選擇合適的水位流量計算公式?
淺談GPU: 衡量計算效能的正確姿勢(1)
評論