国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

gcc編譯時,鏈接器安排的【虛擬地址】是如何計算出來的?

微云疏影 ? 來源:道哥分享 ? 作者:道哥分享 ? 2023-01-24 16:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

問題描述

昨天下午,旁邊的同事在學習Linux系統中的虛擬地址映射(經典書籍《程序員的自我修養-鏈接、裝載與庫》),在看到6.4章節的時候,對于一個可執行的ELF文件中,虛擬地址的值百思不得其解!

例如下面這段C代碼:

首先編譯出32位的可執行程序(為了避開一些與主題無關的干擾因素,采用了靜態鏈接):

gcc -m32 -static test.c -o test

編譯得到ELF格式的可執行文件:test。

這個時候,使用readelf工具來查看這個可執行文件中的段信息(segment):

上圖中的紅色矩形框中,第二個段的地址為什么是 0x080e_9f5c?

這篇文章主要根據書中的解釋,來具體的分析這個值的來龍去脈。

ELF 文件格式

在Linux系統中,有4種類型的文件都是ELF格式,包括:目標文件,可執行文件,動態鏈接庫文件、核心轉儲文件。

如果想系統掌握Linux系統中的底層知識,研究ELF的格式是避免不了的事情。

很久之前總結過這篇文章:《Linux系統中編譯、鏈接的基石-ELF文件:扒開它的層層外衣,從字節碼的粒度來探索》,里面詳細總結了ELF文件的內部結構。

這里就不再贅述了,只要記住2點:

1.從編譯器的角度看,ELF 文件是由很多的節(Section)組成的;

2.從程序加載器的角度看,ELF 文件是又很多的段(Segment)組成的;

其實它倆沒有本質區別,只不過是鏈接器在鏈接階段,把不同目標文件中相同的section組織在一起,形成一個 segment。

對于剛才編譯出的test可執行文件,其加載視圖如下:

可以看到該文件一共有5個段(segment),前2個需要LOAD到內存的段,它們屬性分別是:讀、執行(R E) 和 讀、寫(RW),它們分別是代碼段和數據段。

綠色的箭頭反映出:代碼段中包含了很多的 section;黃色的箭頭反映出數據段也包含了很多的 section。

地址轉換和內存映射

從地址轉換的角度來看:

Linux 系統中CPU中使用的都是虛擬地址,該虛擬地址在尋址的時候,需要經過MMU地址轉換,得到實際的物理地址,然后才能在物理內存中讀取指令,或者讀取、寫入數據。

在現代操作系統中,MMU地址轉換單元基本上都是通過頁表來進行地址轉換的:

當然了,有些系統是兩級轉換(頁目錄、頁表),有些系統是三級或者四級頁表。

從內存映射的角度來看:

操作系統在把一個可執行程序加載到系統中時,把ELF文件中每個段的內容讀取到物理內存中,然后把這個物理內存映射到該段對應的虛擬地址上(VirtAddr)。

假設一個可執行程序中的代碼段長度是1.2K字節, 數據段長度是1.3K字節。

操作系統在把它倆讀取到內存中時,需要 2 個物理內存頁來分別存儲它們(每 1 個物理頁的長度是4K):

雖然每一個物理內存頁的大小是 4K,但是代碼段和數據段實際上只使用了每個頁面剛開始的一段空間。

當CPU中需要讀取物理內存上代碼段中的指令時,使用的虛擬地址是 0x0000_1000 ~ 0x0000_1000 + 1.2K這個區間的地址,MMU單元經過頁表轉換之后,就會得到這個存放著代碼段的物理頁的物理地址。

數據段的尋址方式也是如此:當CPU中需要讀寫物理內存上數據段中的數據時,使用的虛擬地址是 0x0000_2000 ~ 0x0000_2000 + 1.3K這個區間的地址。

MMU單元經過頁表轉換之后,就會得到存放著數據段的物理頁的物理地址。

可以看出在這樣的安排下,每一個段的虛擬地址,都是按照4K(0x1000)對齊的。

如果操作系統都是這樣簡單映射的話,那么事情就簡單多了。

如果按照這樣的安排,來分析一下文章開頭的 test 可執行程序中的虛擬地址安排:

1.代碼段安排的開始虛擬地址是 0x0804_8000,這是 4K 對齊的;

2.代碼段的結束虛擬地址就應該是 0x0804_8000 + 0xa0725 = 0x080e_8725;

3.那么數據段的開始地址就可以安排在 0x080e_8725 之后的下一個 4K 對齊的邊界地址,即:0x080e_9000。

但是這樣的地址安排,嚴重浪費了物理內存空間!

1.2K 字節的代碼段加上1.3K字節的數據段,本來只需要1個物理頁就夠了(4KB),但是這里卻消耗掉2個物理頁(8KB)。

為了減少物理內存的浪費,Linux操作系統就采用了一些巧妙的辦法來減少物理內存的浪費,那就是: 把文件中接壤部分的代碼段和數據段,讀取到同一個物理內存頁中,然后在虛擬地址空間中映射兩次,詳述如下。

Linux 中的內存重復映射

先來看一下test文件的結構:

代碼段在文件中的開始位置是:0x00000,長度是 0xa0725。

數據段的開始位置是:0xa0f5c,長度是0x1024。

可以看到它倆之間有一個空白區間,長度是: 0xa0f5c - 0xa0725 = 0x837(十進制:2103字節)。

由于操作系統在把test文件讀取到物理內存的時候,從文件開始代碼段的0x00000地址開始讀取,按照4KB為一個單位存放到一個物理頁中。

1.文件中代碼段的 0x00000 ~ 0x00FFF 讀取到一個物理頁中;

2.文件中代碼段的 0x01000 ~ 0x01FFF 讀取到物理頁中;

3.下面的內容都是如此分割、復制;

也就是說:相當于把test文件從開始位置,按照4KB為一個單位進行"切割",然后復制到不同的物理內存頁中,如下所示:

注意:這些物理頁的地址很可能是不連續的。

這里有意思的是:代碼段與數據段接壤的這個4KB的空間,它的開始地址是0xA0000,結束地址是0xA0FFF,被復制到物理內存中最上面的橙色物理頁中。

再來看一下代碼段的虛擬地址:在執行gcc指令的的時候,鏈接器把代碼段的虛擬地址安排在0x0804_8000處:

也就是說:當CPU中(或者說程序代碼中),使用0x0804_8000 ~ 0x0804_7FFF 這個區間的地址時,經過地址映射,就會找到物理內存中淺綠色的物理頁,而這個物理頁也對應著test可執行文件開始的第一個4KB的空間。

而且,從虛擬地址的角度看,它的地址都是連續的,對應著test文件中連續的內容,這也是虛擬地址映射的本質。

把代碼段的開始位置安排在 0x0804_8000 地址,這是 Linux 操作系統確定的。

那么考慮一下:代碼段的最后一部分指令相應的4K頁面,其對應的開始虛擬地址是多少呢?

上圖中已經標記出來了,就是虛擬地址中橙色部分:0x080e_8000,計算如下:

通過代碼段的開始地址0x0804_8000,再加上代碼段在內存中的長度0xa0725,結果就是 0x080e_8725。

按照4K (0x1000)對齊之后,最后一個虛擬頁就應該是0x080e_8000。

也就是說:虛擬地址中0x080e_8000 ~ 0x080e_8724 這個區間就對應著test文件中代碼段的最后一部分指令(0x725個字節)。

此外,上圖中最右側:test文件結構中的2個紅色地址:0xA0000, 0xA1000,是如何計算得到的?

代碼段的長度是 0xA0725,按照4K為一個單位來進行分割,也就是把0xA0725對0x1000進行整除,就得到這個4KB的開始地址0xA0000。

同理,下一個4KB的開始地址就是0xA1000。

把文件中這部分4K的數據(包括:一部分代碼段內容 + 0x837 字節空洞 + 一部分數據段內容),復制到上圖中物理內存中最上面的橙色物理頁中。

又因為虛擬地址空間中,0x080E_8000開始的這個4KB空間映射到這個物理頁中,所以:在這個虛擬地址空間中,也有一個0x837字節的空洞,如下所示:

空洞的下方,是代碼段的指令;空洞的上方,是數據段的數據。

現在,這個物理頁中即存放了代碼,又存放了數據。

那么CPU中在查找部分的代碼和數據的時候,必須都能夠找得到才行!

對于代碼段比較好理解:從這個物理頁開始的前0x725個字節是有效的,從虛擬地址的角度看,就是從0x080e_8000開始的前0x725個字節是有效的。

因此,對于這部分代碼的尋址,使用的虛擬地址處于0x080e_8000 ~ 0x080e_8724這個區間中。

那么數據段呢?

重點來了:Linux系統把虛擬地址空間 0x080e_9000 ~ 0x080e_9FFF 也映射到圖中物理內存中最上面的橙色物理頁上!

如下所示:

因為物理頁中,是從0x837個字節空洞的上面開始,才是真正的數據段內容,那么相應的: 虛擬地址0x080e_9000 ~ 0x080e_9FFF空間中,0x837字節上面的內容才是數據段內容。

那么在虛擬地址空間中,這個數據段的開始地址應該是多少呢?

只要計算出0x837字節空洞的上方,距離這個4K頁面開始地址的偏移量就可以了,然后再加上這個4K頁面的起始地址 0x080E_9000,就得到了數據段的開始地址(虛擬地址)。

因為虛擬地址、物理地址、test文件中,都是按照4K的單位進行劃分的,因此這個偏移量就等于:test文件中數據段的開始地址(0xA0F5C) 距離 這個頁面的開始地址(0xA0000) 的偏移量。

0xA0F5C - 0xA0000 = 0xF5C 。

即:從這個4K頁面的開始地址,偏移量為0xF5C的地方,才是數據段內容的開始。

因此對于虛擬地址來說,從0x080e_9000地址開始,偏移量為0xF5C之后的內容才是數據段的內容,這個地址值就是:0x080e_9000 + 0xF5C = 0x080e_9F5C,如下所示:

這個地址正是readelf工具讀所顯示的:數據段加載到虛擬地址空間中的開始地址,如下所示:

至此,就解釋了文章開頭提出的問題!

再來看一下整個數據段的內容:在內存中數據段占據的空間是 0x01e48(readelf 工具讀取到的 MemSiz),那么數據段的結束地址就是(虛擬地址):

0x080e_9F5C + 0x01e48 = 0x080e_bda4

如下所示:

小結

Linux系統中的這個操作:對屬于不同段的內容進行重復映射,有點類似于共享內存的味道了。

只不過這里重復映射之后,每個段的虛擬地址還是需要修正為該段的合法地址。

經過這樣的操作之后,在虛擬地址中每一個段的界限是涇渭分明的,但是映射到的物理內存頁,則有可能是同一個。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Linux
    +關注

    關注

    88

    文章

    11760

    瀏覽量

    219032
  • 操作系統
    +關注

    關注

    37

    文章

    7402

    瀏覽量

    129300
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    lab view NI6003搭建電路

    各位大佬,用labview程序仿真光敏電阻,得出電阻電壓電流各類數據,光敏電阻的電壓可以用lab view程序測試出來,電阻用萬用表測試出來,電流用歐姆定律計算出來,但是需要搭建一個外置電路,請問這個電路怎么設計,是像下圖這樣的
    發表于 03-03 19:42

    ADC芯片溫度計算出來的溫度有時錯的離譜,為什么?

    以下是庫函數里關于溫度計算的要點,芯片手冊里也是這樣描述的: 讀取ADC參考電壓1.5V時的溫度傳感的測量溫度 void ADC_GetTsVref1V5(float *fAdcTsDegree
    發表于 01-22 06:39

    編譯器如何指定代碼的地址段?

    我在官方 gcc 的基礎上添加了自定義指令,目前可以正確編譯出匯編代碼,但是我該如何指定匯編結果的地址段,讓生成的代碼符合蜂鳥的地址分配呢?求助大神幫助指導一下,thx~
    發表于 11-10 06:06

    關于系統鏈接腳本的介紹

    Flash里面,但上電后上載至ITCM中進行執行(flash模式) 三、關于物理地址虛擬地址 物理地址是該程序要被存儲的存儲地址(調試
    發表于 10-30 08:26

    飛凌嵌入式ElfBoard-Vim編輯GCC的基本使用

    /example/hello$ gcc hello.c1.GCC編譯過程GCC編譯器編譯過程要
    發表于 10-16 09:05

    貼片電容的精度是怎么計算出來的?

    貼片電容的精度通過 實際電容值與標稱電容值的偏差范圍 計算得出,其核心計算邏輯和關鍵要點如下: 一、精度定義與計算公式 貼片電容的精度表示實際電容值與標稱值的允許偏差范圍,計算公式為:
    的頭像 發表于 10-11 15:01 ?1358次閱讀
    貼片電容的精度是怎么<b class='flag-5'>計算出來</b>的?

    MOS管的連續電流ID計算示例

    在電子電路的設計中,MOS管是一種極為重要的分立器件,它廣泛應用于電源管理、電機驅動等眾多領域。而在MOS管的規格書中,連續電流ID這個參數備受關注。那么,MOS的規格書上的連續電流ID究竟是怎么計算出來的呢?今天我們就來解析其背后的計算邏輯。
    的頭像 發表于 09-22 11:04 ?1465次閱讀
    MOS管的連續電流ID<b class='flag-5'>計算</b>示例

    如何計算出管殼式換熱器和板式換熱器的長寬高,江蘇睿翌

    如何計算出管殼式換熱器和板式換熱器的長寬高,江蘇睿翌確定換熱器的長、寬、高(更準確地說,是確定其關鍵尺寸)是一個系統性的設計過程,而不是簡單的計算。它需要綜合考慮熱力學、流體力學、材料學和實際工況
    發表于 08-27 09:53

    請問STM32N6的攝像頭下采樣是怎么實現的?

    在N6的例程里面實現了把imx335的2592x1944下采樣到800x480,但是這里的參數配置是怎么計算出來的,還有如果我想要把這個配置為224*160的話,我得怎么修改? /[i
    發表于 07-11 07:29

    綠氫系統 PEM 電解槽直流接入仿真驗證深度解析

    為 PEM 模塊實時計算出來的實際消耗電流。藍色部分為 AC/DC,綠色部分為 DC/DC。 AC/DC 通過整流將網側交流電壓轉換成直流電壓,接著通過 DC/DC 拓撲,將 PEM 等效負載的電壓
    發表于 07-03 18:25

    LT3482的OUT2引腳電壓與APD引腳電壓是什么關系?如何通過OUT2電壓 計算APD引腳電壓 ?

    你好, 如下圖,通過 OUT2電壓計算公式 OUT2電壓為 89.44V,而如下圖APD引腳 的 85V ,是怎么計算出來的。? LT3482 的 OUT2 引腳電壓計算公式:
    發表于 04-17 06:20

    AD2S1200解碼芯片的精度是11弧分,這個數值是怎么計算出來的?

    請問一下,AD2S1200解碼芯片的精度是11弧分,這個數值是怎么計算出來的?
    發表于 04-15 06:20

    Linux內核編譯失敗?移動硬盤和虛擬機的那些事兒

    Linux開發中,編譯內核是一項常見任務,但不少開發者在移動硬盤或虛擬機環境下嘗試時會遭遇失敗。本文將簡要探討這些問題的成因,并介紹一些虛擬機使用技巧,幫助大家更好地應對相關問題。在移動硬盤里
    的頭像 發表于 04-11 11:36 ?994次閱讀
    Linux內核<b class='flag-5'>編譯</b>失敗?移動硬盤和<b class='flag-5'>虛擬</b>機的那些事兒

    scons+gcc每次編譯后,如何才能打印出error總數和warning總數?

    MDK 和 IAR 編譯器好像有這樣的功能,不知道gcc怎么才能搞出來這種功能? 謝謝!
    發表于 04-01 06:21

    STM32F1 xcube cryptolib ECDSA計算出來的摘要值和外部驗證工具計算出來的簽名值對不上怎么解決?

    STMF1 xcube cryptolib ECDSA簽名,采用CMOX_ECC_CURVE_SECP256R1曲線、SHA256摘要算法,計算出來的摘要值和外部驗證工具計算出來的簽名值對不上,外部
    發表于 03-07 09:24