前言
.NET8里面JIT引入了一個(gè)新的機(jī)制,叫做Non-GC Heap。JIT可以確保相關(guān)對(duì)象分配在Non-GC Heap上,該堆像其名稱一樣,不受GC管理。JIT需要保證這個(gè)對(duì)象沒有被GC引用,并且在這個(gè)對(duì)象的生命周期內(nèi)一直是根對(duì)象(不會(huì)被GC消滅的對(duì)象)的狀態(tài)。
概述
為什么要引入這種機(jī)制?先來看一段代碼:
public static string GetPrefix() => "https://";
static void Main(string[] args)
{
GetPrefix ();
}
這里的GetPrefix函數(shù)返回的是一個(gè)常量字符串值,它的ASM如下:
mov rax,185CAC02068h mov rax,qword ptr [rax]
兩個(gè)mov指令,第一個(gè)是對(duì)象指針的指針,第二個(gè)是對(duì)象的指針。雖然是簡(jiǎn)單的兩個(gè)指令,但是背后的邏輯卻較為復(fù)雜,基本如下:
一個(gè)字符串常量值,.NET7里面JIT也會(huì)給這個(gè)字符串常量值復(fù)制到一個(gè)堆分配到字符串對(duì)象中,返回的是對(duì)象的二級(jí)指針。因?yàn)槭嵌褜?duì)象,可能會(huì)被GC移動(dòng),每次都需要獲取新的地址,頻繁增加負(fù)擔(dān)。
這里的問題在哪兒呢?一個(gè)字符串常量值需要這么多的步驟操作嗎?開銷是否太大,我們是否可以簡(jiǎn)化它呢?有一個(gè)常規(guī)的很容易想到的方法,就是把這個(gè)字符串常量值的地址給它固定起來,每次需要用到這個(gè)常量值,就直接去這個(gè)固定地址讀取,這樣行不行呢?GC堆很明顯不能硬編碼固定。
當(dāng)然可以,做法就是把這個(gè)字符串常量值放到POH(固定對(duì)象堆)上,不讓GC移動(dòng)。這樣是減少了GC回收的時(shí)候移動(dòng)的開銷,但是并沒有從根本上解決問題,因?yàn)楣潭▽?duì)象同樣受到GC的管控,上面的步驟除了不能移動(dòng)一樣不少,并且POH不會(huì)進(jìn)行根對(duì)象的處理,可能會(huì)導(dǎo)致它們被回收,地址指向了其它的數(shù)據(jù),進(jìn)而錯(cuò)誤。
特點(diǎn)
要徹底的解決這個(gè)問題,本篇的主角:Non-GC Heap出場(chǎng)了。它有三個(gè)特點(diǎn):
1.JIT要保證這個(gè)對(duì)象沒有被GC引用
2.這個(gè)對(duì)象在生命周期內(nèi)一直是根對(duì)象
3.它不能是可卸載上下文的一部分
你可以認(rèn)為GC堆包括:小對(duì)象堆(SOH-小于85000字節(jié)的對(duì)象),大對(duì)象堆(LOH-大于85000字節(jié)的對(duì)象),固定對(duì)象堆(POH)
而No-GC Heap超脫于GC Heap之外的FOH(凍結(jié)堆)。
JIT現(xiàn)在可以避免在生成的代碼中訪問該對(duì)象時(shí)的間接尋址,而是直接硬編碼對(duì)象的地址
GetPrefix函數(shù)的ASM在.NET8 Non-GC Heap里面如下:
mov rax,26180000218h C3 ret
26180000218h為對(duì)象地址,一個(gè)mov直接返回。看似只簡(jiǎn)化了一個(gè)mov,但是實(shí)際上它這種硬編碼固定模式地址,簡(jiǎn)化的是整個(gè)字符串常量值的原理,也就是把字符串常量值分配到FOH里面,而不是GC堆里。性能極大的提升自不必多說。以下測(cè)量13倍的性能提升。
Method Job Mean Ratio GetPrefix .NET 7 1.3450 ns GetPrefix.NET80.0729ns
其它Non-GC Heap的操作
一:使用typeof(T)生成的RuntimeType對(duì)象
public Type GetTestsType() => typeof(Tests);
二:空數(shù)組分配到Non-GC Heap上,使Array.Empty()更加高效
public string[] Test() => Array.Empty();
它倆在.NET8里面都類似于如下ASM,一個(gè)mov直接返回:
mov rax,1A0814EAEA8 ret
三:靜態(tài)值類型字段關(guān)聯(lián)的堆對(duì)象,不包含任何GC引用的字段
public partial class Tests
{
private static readonly ConfigurationData s_config = ConfigurationData.ReadData();
public TimeSpan GetRefreshInterval() => s_config.RefreshInterval;
private struct ConfigurationData
{
public static ConfigurationData ReadData() => new ConfigurationData
{
Index = 0x12345,
Id = Guid.NewGuid(),
IsEnabled = true,
RefreshInterval = TimeSpan.FromSeconds(100)
};
public int Index;
public Guid Id;
public bool IsEnabled;
public TimeSpan RefreshInterval;
}
}
RefreshInterval .NET7如下:
mov rax,13D84001F78 mov rax,[rax] mov rax,[rax+20] ret
RefreshInterval .NET8如下:
mov rax,20D9853AE48 mov rax,[rax] ret
四:代之間的GC引用判斷
代碼:
public class Tests
{
public void Write()
{
string dst = "old";
Write(ref dst, "new");
}
[MethodImpl(MethodImplOptions.NoInlining)]
private static void Write(ref string dst, string s) => dst = s;
}
Write在.NET7和.NET8上生成如下:
callCORINFO_HELP_CHECKED_ASSIGN_REF nop ret
CORINFO_HELP_CHECKED_ASSIGN_REF是一個(gè)JIT幫助程序函數(shù),其中包含所謂的“GC write barrier (GC寫屏障)”,一個(gè)小代碼片段,用于讓GC跟蹤正在寫入的引用,因?yàn)樗赡苄枰溃纾驗(yàn)檎诜峙涞膶?duì)象可能是gen0,而目標(biāo)可能是gen2。
微調(diào)下這個(gè)代碼:
public class Tests
{
public void Write()
{
string dst = "old";
Write(ref dst);
}
[MethodImpl(MethodImplOptions.NoInlining)]
private static void Write(ref string dst) => dst = "new";
}
實(shí)現(xiàn)的功能都是一樣的,只不過dst直接賦值了常量字符串,記得上面常量字符串的分配是在Non-GC Heap嗎?.NET7里面還是需要幫助函數(shù):
mov rdx,1FF0E4014A0 movrdx,[rdx] callCORINFO_HELP_CHECKED_ASSIGN_REF nop ret
然.NET8里面則是
mov rax,1B3814EAEC8 mov [rcx],rax ret
因?yàn)?NET8意識(shí)到常量字符串是在Non-GC Heap,不需要GC跟蹤判斷在那個(gè)代碼,類似于card_table那種。所以優(yōu)化掉了CORINFO_HELP_CHECKED_ASSIGN_REF
審核編輯:劉清
-
MOV
+關(guān)注
關(guān)注
0文章
65瀏覽量
14373 -
ASM
+關(guān)注
關(guān)注
1文章
69瀏覽量
19882 -
字符串
+關(guān)注
關(guān)注
1文章
596瀏覽量
23165 -
SOH
+關(guān)注
關(guān)注
0文章
19瀏覽量
3932
原文標(biāo)題:.NET8極致性能優(yōu)化Non-GC Heap
文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
shell原理和問答機(jī)制引入推薦
RT_USING_HEAP該怎樣去理解呢
Oracle數(shù)據(jù)庫網(wǎng)絡(luò)安全訪問機(jī)制
PCIe總線的通信機(jī)制
深度解析Asp.Net2.0中的Callback機(jī)制
heap_1內(nèi)存分配方法
FreeRTOS heap_3內(nèi)存分配方法
如何解決引入注冊(cè)機(jī)制問題
.NET8為原生AOT改進(jìn) Linux上原生AOT應(yīng)用程序大小最多減少50%
zookeeper引入什么機(jī)制
.NET8極致性能優(yōu)化AOT
OPCUA產(chǎn)品情報(bào):.NET SDK最新版本公布,系列產(chǎn)品穩(wěn)步更新中!
.NET8為什么要引入Non-GC Heap這種機(jī)制呢?
評(píng)論