前言
.NET8对于性能的优化是方方面面的,所以AOT预编译机器码也是不例外的。本篇来看下对于AOT的优化。原文:.NET8极致性能优化AOT
详述
首先明确一个概念,.NET里面的AOT它是原生的。什么意思呢?也就是说通过ILC编译器(AOT编译器,参考:.Net 7 新编译器 ILC 简析)编译出来的代码是各个平台上可以直接运行的二进制代码。比如MacOS的二进制,Linux二进制等等。所以称之为原生。
C#源码被ILC编译之后,生成了一个完全原生态代码的可执行文件。在执行的时候不需要JIT来编译任何东西,因为JIT已经在ILC里面被充分利用过了。实际上AOT里面也没有包含JIT。那么它如何优化呢?只能是在ILC里面调用JIT的时候了。所以它这个优化依然依靠JIT。.NET8里面优化AOT的一个典型的例子,就是ASP.NET应用程序在使用AOT的时候表现不错,同时也降低了总成本。
1.优化
在.NET8里面优化AOT的一个重要的目标就是减少AOT可执行文件的大小,关于这点的效果。我们现在就可以看到
下面创建一个控制台应用程序
dotnet new console -o nativeaotexample -f net7.0
由于上面是通过.NET7.0创建的,我们把这个控制台的csproj更改下
<TargetFramework>net7.0</TargetFramework> 改为 <TargetFrameworks>net7.0;net8.0</TargetFrameworks>
可以轻松的构建.NET7.0或者.NET8.0的程序
继续
把<PropertyGroup>...</PropertyGroup>项中添加如下 <PublishAot>true</PublishAot>编译成AOT文件
下面我们就可以通过dotnet publish发布它了,linux如下:
dotnet publish -f net7.0 -r linux-x64 -c Release
现在它生成了一个.NET7.0版本的独立可执行文件,可通过 ls/dir 输出目录以查看生成的二进制大小
12820K /home/stoub/nativeaotexample/bin/Release/net7.0/linux-x64/publish/nativeaotexample
这个大约是13M左右,我们再来看下.NET8.0
dotnet publish -f net8.0 -r linux-x64 -c Release
生成的可执行文件大小如下:
1536K /home/stoub/nativeaotexample/bin/Release/net8.0/linux-x64/publish/nativeaotexample
1.5M的大小,这个优化的力度不可不大。优化了将近10倍的体积。这就是.NET8.0的优化魔力。
2.继续优化
但是优化的情况远不止如此,比如说我们可以配置csproj使AOT的体积更小
csproj添加如下size表示要生成的AOT大小
<OptimizationPreference>Size</OptimizationPreference>
如果我们不需要全球化代码和数据,需要特定的代码和数据,并且使用不变模式,可以csproj添加如下选项
<InvariantGlobalization>true</InvariantGlobalization>
如果你不想在AOT异常的时候抛出堆栈,那么你也可以在csproj里面添加如下
<StackTraceSupport>false</StackTraceSupport>
重新通过dotnet publish net8.0发布了之后,它的体积还可以继续减小
1248K /home/stoub/nativeaotexample/bin/Release/net8.0/linux-x64/publish/nativeaotexample
再次缩小了0.3M大小。
然而,你以为到此优化就为止了吗?并没有,.NET8不仅对AOT编译器内部进行了改进,而且还对单个库也进行了性能优化和改进。比如HttpClient。
3.其它优化
当然除了体积的优化之外,还有其它的优化,比如避免了在读取静态字段时的辅助调用,再比如BenchmarkDotNet 也是支持AOT化的,也就是性能测试上面的支持。我们可以只使用 --runtimes nativeaot7.0 nativeaot8.0,而不使用 --runtimes net7.0 net8.0,如下代码
// dotnet run -c Release -f net7.0 --filter "*" --runtimes nativeaot7.0 nativeaot8.0 using BenchmarkDotNet.Attributes; using BenchmarkDotNet.Running; BenchmarkSwitcher.FromAssembly(typeof(Tests).Assembly).Run(args); [HideColumns("Error", "StdDev", "Median", "RatioSD")] public class Tests { private static readonly int s_configValue = 42; [Benchmark] public int GetConfigValue() => s_configValue; }
上面代码可以通过如下AOT化运行
dotnet run -c Release -f net7.0 --filter "*" --runtimes nativeaot7.0 nativeaot8.0
BenchmarkDotNet 输出如下
Method Runtime Mean Ratio GetConfigValue NativeAOT 7.0 1.1759 ns 1.000 GetConfigValue NativeAOT 8.0 0.0000 ns 0.000
可以看到即使是性能测试的Benchmark,AOT优化也是不放过的。
另外还值得一提的地方就是分层,因为AOT里面没有分层的概念。但是即时编译也就是不是AOT编译的时候,一个方法从tier0提升到tier1,方法里面的静态字段必须被初始化过了。AOT里面添加了一个快速路径检查字段是否初始化,避免一些不必要的开销。
其它的一些改进,比如AOT锁的实现方式。使用了一种混合方式,开始使用轻量级自旋锁,后面升级到使用 System.Threading.Lock 类型,这个应该会在.NET9.0里面释放出来。
欢迎加入C#12.NET8最新技术交流群
结尾
作者:jianghupt
原文:.NET8极致性能优化AOT
文章公众号(jianghupt)首发,欢迎关注。