最近在看 C++ 类继承中的字段内存布局,我就很好奇 C# 中的继承链那些 private 字段都哪里去了? 在内存中是如何布局的,毕竟在子类中是无法访问的。
一:举例说明
为了方便讲述,先上一个例子:
internal class Program { static void Main(string[] args) { Chinese chinese = new Chinese(); int num = chinese.b; //b 字段无法访问,编译报错 Console.WriteLine(num); } } public class Person { public int a = 10; private int b = 11; } public class Chinese : Person { public int c = 12; }
根据 C# 的类继承原则,上面的 chinese.b
写法肯定是无法被编译的,因为它属于父类的 私有字段,既然无法被访问,那这个 private b
到底去了哪里呢? 要想找到答案,只能先从 chinese
实例处的汇编代码看起,看看有没有什么意外收获。
二:查看 chinese 处汇编代码
在 new chinese()
处下一个断点,查看 Visual Stduio 2022
的反汇编窗口。
接下来我稍微解读下:
1. 根据 MT 类型 实例化 chinese
07FD6176 mov ecx,87205C4h 07FD617B call CORINFO_HELP_NEWSFAST (06E30C0h)
这里的 87205C4h
就是 Chinese 类型的 MT,然后通过 CLR 下的 CORINFO_HELP_NEWSFAST
处的方法进行实例化。
2. 使用 chinese 的构造函数进行类初始化
07FD6180 mov dword ptr [ebp-40h],eax 07FD6183 mov ecx,dword ptr [ebp-40h] 07FD6186 call CLRStub[MethodDescPrestub]@7e34871e07fd5d20 (07FD5D20h) 07FD618B mov eax,dword ptr [ebp-40h]
这里的 eax 是 CORINFO_HELP_NEWSFAST
初始化方法的返回值,可以在 ecx,dword ptr [ebp-40h]
处下一个断点,观察它的内存布局。
从布局图看,此时的 chinese 只是一个清零的默认状态,此时的 a,b,c
三个字段还没有被赋值,那什么时候被赋值呢? 这就是构造函数要做的事情了,也就是上面的 CLRStub[MethodDescPrestub]@7e34871e07fd5d20 (07FD5D20h)
指令,接下来在 07FD618B
处下一个断点,再次观察 0x02C9F528
处的内存地址,也就是 ebp-40
的位置,接下来我们继续执行,截图如下:
从图中可以看到,当构造函数执行完之后,有三处内存地址(变红)被赋值了,依次是 a,b,c
,这时候是不是让人眼前一亮。
3. 洞察真相
原来那个 b=11
并没有丢,而是被 chinese
类给完全继承下来的,而且布局规则是 父类
字段在前, 子类
字段在后的一种方式,有点意思,接下来的问题是如何把它提取出来?
三:如何提取 b 字段
如果是 C 语言,我们用 *(pointer+2)
就可以轻松提取,那用托管的 C# 如何去实现呢? 可以用复杂的 Marshal
包装类,应该也可以变相的使用 Span
去搞定,这里我就不麻烦了,直接用非安全代码下的 指针
去摆平,在 a
字段偏移 +4 的位置上提取, 参考代码如下:
static void Main(string[] args) { unsafe { Chinese chinese = new Chinese(); fixed (int* ch = &chinese.a) { int b = *(ch + 1); Console.WriteLine($"b={b}"); } } } }
哈哈,是不是挺有意思。