前言:

太懒了,从没有在这里正儿八经的写过文章。看到一些人的高产,真是惭愧。决定稍微变得不那么懒。如有疏漏,请指正。

.net的GC都谈的很多了,本篇主要是剑走偏锋,聊聊一些个人认为较为核心的细节方面的问题。至于,标记,计划,压缩,清扫这些不在讨论之列。

动态函数头地址的一些概念:

一段内存有内存的起始地址(暂叫base),内存的结束地址,以及内存指针当前指向的地址大致的三个概念。而在这段内存里面分配了函数之后,一个函数在内存里面必定有一个函数的起始地址也就是指令(第一个push)所在的地址,称之为函数头地址,函数的结束地址也就是指令(ret)所在的地址。在函数里面做了一些事情,那么这些可以称之为函数中间的某个地址。

通过函数中间的某个地址(不固定的)获取到函数头地址(固定的)。称之为动态获取函数头地址

硬编码动态获取到函数头地址之后,你就可以得到GC信息,方法描述符信息,调试信息,异常信息,回滚信息,帧栈信息等等。

C#代码:

    static void Main(string[] args)
{
GC.Collect();
Console.ReadLine();
}

把这段代码反汇编一下:

7:         static void Main(string[] args)
8: {
00007FFB098C5EC0 55 push rbp
00007FFB098C5EC1 57 push rdi
00007FFB098C5EC2 56 push rsi
00007FFB098C5EC3 48 83 EC 30 sub rsp,30h
00007FFB098C5EC7 48 8B EC mov rbp,rsp
00007FFB098C5ECA 33 C0 xor eax,eax
00007FFB098C5ECC 48 89 45 28 mov qword ptr [rbp+28h],rax
00007FFB098C5ED0 48 89 4D 50 mov qword ptr [rbp+50h],rcx
00007FFB098C5ED4 83 3D 95 CB 09 00 00 cmp dword ptr [7FFB09962A70h],0
00007FFB098C5EDB 74 05 je ConsoleApp10.Program.Main(System.String[])+022h (07FFB098C5EE2h)
00007FFB098C5EDD E8 0E 27 CB 5F call 00007FFB695785F0
00007FFB098C5EE2 90 nop
9: GC.Collect();
00007FFB098C5EE3 E8 70 ED FF FF call CLRStub[MethodDescPrestub]@7ffb098c4c58 (07FFB098C4C58h)
00007FFB098C5EE8 90 nop
10: Console.ReadLine();
00007FFB098C5EE9 E8 42 FF FF FF call CLRStub[MethodDescPrestub]@7ffb098c5e30 (07FFB098C5E30h)
00007FFB098C5EEE 48 89 45 28 mov qword ptr [rbp+28h],rax
00007FFB098C5EF2 90 nop
11: }
00007FFB098C5EF3 90 nop
00007FFB098C5EF4 48 8D 65 30 lea rsp,[rbp+30h]
00007FFB098C5EF8 5E pop rsi
00007FFB098C5EF9 5F pop rdi
00007FFB098C5EFA 5D pop rbp
00007FFB098C5EFB C3 ret

我们看到地址:00007FFB098C5EC0就是函数头的地址。00007FFB098C5EFB则是函数结束地址。中间的比如调用GC.Collection的地址00007FFB098C5EE3和调用Console.ReadLine的地址00007FFB098C5EE9,则可以称之为中间地址。

如何通过中间的某个地址(可能是00007FFB098C5EE3,也可能是00007FFB098C5EE9,还有可能是中间其它地址)动态的找到函数头的固定地址呢?

计算公式一:奇偶数的偏移(value-1)

我们先来看下函数头地址:00007FFB098C5EC0,在内存里面的存储数值。

CLR的操作是:

value-1 =(00007FFB098C5EC0 - base) & 31 >>2+1

base:是函数所在内存的其实地址

value-1:是计算的结果

这个value-1的结果要么是1,要么是5,为啥?仔细分析下。一般的来说,base也就是函数所在的内存的其实地址末尾两字节一般都是 00 00。也就是说base - 00007FFB098C5EC0的结果一定四0xnnnnnnnnnnnn5EC0。n表示未知数。因为上面的公式&31,所以只需要关注最后两个字节就可以了。

回到上面为啥value-1等于1或者5呢?不能等于其它。5EC0中C0的二进制是:

1100 0000。把它&31,结果是0。0>>2还是0。然后加上1,结果也就是value-1等于1.

那么5是怎么来的呢?我们注意看,0xC是能被2整除的偶数。如果是不能被2整除的奇数,比如0xD的话,低位的向左第五位必定位1,其它第四位无论是什么,右移2之后一定是4,然后 4+1 等于5。

所以低位向左第五位如果是偶数,则value-1为1,如果是奇数则value-1为5。不能有其它,此处大家可以自行验证。

关于计算公式参考:https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/codeman.cpp

计算公式二:0的个数的32位索引

标题头的意思是:以0的个数表示有几个32

还是按照上面来,此处函数头的其实地址是:00007FFB098C5EC0。这里的计算公式略有不同:

value-2 = 28 - (00007FFB098C5EC0 - base) >> 5 & 7 << 2

同样:

base:表示函数所在内存的起始地址

value-2 则是此公式计算的结果

因为此公式右移的是5,而且base最后两位一般为0。所以只需要看最后一字节也就是C0即可。

1100 0000 右移5位,结果为0110,也就是6。6&7等于6,6左移2,结果为0x18。十进制的24。然后28-24 ==4。value-2的结果为4。

公式一计算得出的value-1的值为1。因为C0的C是偶数。所以为1。

公式二计算得出的value-2的值为4。

value = value-1 << value-2

value就是最终函数头地址:00007FFB098C5EC0在内存里面存储的形式,二进制表示就是:0001 0000。十进制的:16 。十六进制的:0x10 。

关于计算公式参考:https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/codeman.cpp

中间地址计算动态找出函数头:

此处中间地址取GC.Collection的地址:00007FFB098C5EE3。

startPos = (00007FFB098C5EE3 - base) >> 5,此处取GC.Collection地址的最后两位5EE3 >> 5。结果为:startPos = 0x2F7。

首先从内存里面取出公式二里面计算的value值:0x10。然后套用公式二的value-2的计算:

Result = 28 -(00007FFB098C5EE3 - base) >> 5 & 7 << 2

很明显Result的结果为 0

把tmp = value >> Result 。

结果tmp == 0x10。

 if (tmp)
{
startPos--;
while (!(tmp & NIBBLE_MASK))
{
tmp = tmp >> NIBBLE_SIZE;
startPos--;
}
return base + POSOFF2ADDR(startPos, tmp & NIBBLE_MASK);
}

NIBBLE_MASK:0xf

POSOFF2ADDR: startPos << 5 + (tmp -1 ) << 2

因为tmp为0x10,所以startPos--。 2f7-1 == 2f6 。然后因为 !(tmp & NIBBLE_MASK) 所以 tmp = tmp >> NIBBLE_SIZE; 也就是 tmp == 1。

那么结果就是 base + 2f6 << 5 + (1 -1) << 2

用n表示未知数 0xnnnnnnnnnnnn5EC0。刚好是函数头的地址。

此方法适用于任何一个中间地址动态获取函数头地址。

过程

我们在C#源代码中调用GC.Collection会运行以下几个步骤:

1.GC.Collection()

2.GCScanRoot()

3.EECodeInfo.Init(寄存器Rip)

4.FindMethodCode(寄存器Rip)

5.通过FindMethodCode找到函数头地址,然后通过函数头的地址-8。得到的就是EHinfo,DebugInfo,GCinfo,MethodDesc,UwndInfo信息

6.通过GCinfo找到根对象

7.通过根对象遍历所有对象

8.在这些对象中找到非存活对象,然后进行回收

这个过程过于复杂,省略了很多与本节主题无关的东西。我们看到FindMethodCode就是获取到函数头的地址的函数。

公式一和二的参考如下:

公式一:

void EEJitManager::NibbleMapSetUnlocked(HeapList * pHp, TADDR pCode, BOOL bSet)
{
CONTRACTL {
NOTHROW;
GC_NOTRIGGER;
} CONTRACTL_END; // Currently all callers to this method ensure EEJitManager::m_CodeHeapCritSec
// is held.
_ASSERTE(m_CodeHeapCritSec.OwnedByCurrentThread()); _ASSERTE(pCode >= pHp->mapBase); size_t delta = pCode - pHp->mapBase; size_t pos = ADDR2POS(delta);
DWORD value = bSet?ADDR2OFFS(delta):0; DWORD index = (DWORD) (pos >> LOG2_NIBBLES_PER_DWORD);
DWORD mask = ~((DWORD) HIGHEST_NIBBLE_MASK >> ((pos & NIBBLES_PER_DWORD_MASK) << LOG2_NIBBLE_SIZE)); value = value << POS2SHIFTCOUNT(pos); PTR_DWORD pMap = pHp->pHdrMap; // assert that we don't overwrite an existing offset
// (it's a reset or it is empty)
_ASSERTE(!value || !((*(pMap+index))& ~mask)); // It is important for this update to be atomic. Synchronization would be required with FindMethodCode otherwise.
*(pMap+index) = ((*(pMap+index))&mask)|value;
}

公式二:

TADDR EEJitManager::FindMethodCode(RangeSection * pRangeSection, PCODE currentPC)
{
LIMITED_METHOD_DAC_CONTRACT; _ASSERTE(pRangeSection != NULL); HeapList *pHp = dac_cast<PTR_HeapList>(pRangeSection->pHeapListOrZapModule); if ((currentPC < pHp->startAddress) ||
(currentPC > pHp->endAddress))
{
return NULL;
} TADDR base = pHp->mapBase;
TADDR delta = currentPC - base;
PTR_DWORD pMap = pHp->pHdrMap;
PTR_DWORD pMapStart = pMap; DWORD tmp; size_t startPos = ADDR2POS(delta); // align to 32byte buckets
// ( == index into the array of nibbles)
DWORD offset = ADDR2OFFS(delta); // this is the offset inside the bucket + 1 _ASSERTE(offset == (offset & NIBBLE_MASK)); pMap += (startPos >> LOG2_NIBBLES_PER_DWORD); // points to the proper DWORD of the map // get DWORD and shift down our nibble PREFIX_ASSUME(pMap != NULL);
tmp = VolatileLoadWithoutBarrier<DWORD>(pMap) >> POS2SHIFTCOUNT(startPos); if ((tmp & NIBBLE_MASK) && ((tmp & NIBBLE_MASK) <= offset) )
{
return base + POSOFF2ADDR(startPos, tmp & NIBBLE_MASK);
} // Is there a header in the remainder of the DWORD ?
tmp = tmp >> NIBBLE_SIZE; if (tmp)
{
startPos--;
while (!(tmp & NIBBLE_MASK))
{
tmp = tmp >> NIBBLE_SIZE;
startPos--;
}
return base + POSOFF2ADDR(startPos, tmp & NIBBLE_MASK);
}
}

你也可以直接参考:

https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/codeman.cpp

微信公众号:jianghupt. QQ群:676817308

.Net CLR GC动态获取函数头地址,C++的骚操作(慎入)的更多相关文章

  1. C# — 动态获取本地IP地址及可用端口

    1.在VS中动态获取本地IP地址,代码如下: 2.获取本机的可用端口以及已使用的端口:

  2. php中如何动态获取函数的参数

    php动态获取函数参数 一.总结 一句话总结:a.PHP 在用户自定义函数中支持可变数量的参数列表.其实很简单,只需使用 func_num_args() , func_get_arg() ,和 fun ...

  3. java版gRPC实战之六:客户端动态获取服务端地址

    欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...

  4. 旧书重温:0day2【4】动态获取函数地址

    通过以上3篇文章的学习,我们已经可以获取到kernel32.dll的地址了下一步 我们就是获取几个重要的函数 1.GetProcAddress 2.LoadLibrary 有了这两个函数很多函数都可以 ...

  5. 获取函数的地址(三种方法,分别是@,Addr,MethodAddress)

    问题来源: http://www.cnblogs.com/del/archive/2008/07/30/1039045.html#1272783 在编译器看来, 重载函数根本就是完全不同的几个函数, ...

  6. .Net CLR GC 动态加载短暂堆阈值的计算及阈值超量的计算

    前言: 很多书籍或者很多文章,对于CLR或者GC这块只限于长篇大论的理论性概念,对于里面的如何运作模式,却几乎一无所知.高达近百万行的CPP文件,毕竟读懂的没有几个.以下取自CLR.Net 6 Pre ...

  7. php动态获取函数参数

    PHP 在用户自定义函数中支持可变数量的参数列表.其实很简单,只需使用 func_num_args() , func_get_arg() ,和 func_get_args()  函数即可. 可变参数并 ...

  8. PHP实现动态获取函数参数的方法

    1. func_num_args — 返回传入函数的参数总个数 int func_num_args ( void ) 示例 <?php function demo () { $numargs = ...

  9. 日志系统实战(二)-AOP动态获取运行时数据

    介绍 这篇距上一篇已经拖3个月之久了,批评自己下. 通过上篇介绍了解如何利用mono反射代码,可以拿出编译好的静态数据.例如方法参数信息之类的. 但实际情况是往往需要的是运行时的数据,就是用户输入等外 ...

随机推荐

  1. 小白文-Git-版本控制

    推荐阅读 Git学习-图文并茂还有游戏玩! Git版本控制 注意:开始学习之前,确保自己的网络可以畅通的连接Github:https://github.com,这个是一个国外网站,连起来特别卡,至于用 ...

  2. Hyperledger Fabric的test-network启动过程Bash源码详解

    前言 在基于Debian搭建Hyperledger Fabric 2.4开发环境及运行简单案例中,我们已经完成了Fabric 2.4的环境搭建及fabric-samples/test-network官 ...

  3. Java 使用-安装

    Java 使用-安装 官方网站 JDK 下载地址 JDK 历史版本 参考资料 CentOS7系统卸载自带的OpenJDK并安装SUNJDK CentOS7卸载 OpenJDK 安装Sun的JDK8 安 ...

  4. Go xmas2020 学习笔记 04、Strings

    04-Strings.unicode.utf-8.类型描述符.go 字符串在内存中的存储. Strings. String structure. String functions. Practice

  5. ASP.NET Core WebApi返回结果统一包装实践

    前言 近期在重新搭建一套基于ASP.NET Core WebAPI的框架,这其中确实带来了不少的收获,毕竟当你想搭建一套框架的时候,你总会不自觉的去想,如何让这套框架变得更完善一点更好用一点.其中在关 ...

  6. Java学习day27

    今天跟着做了一个模拟龟兔赛跑的程序 只有一条赛道,乌龟和兔子在同一条赛道上比赛,使用了多线程 为了实现兔子睡觉,在run方法内增加了当前奔跑者是否是兔子的判断且当前奔跑步数是否是10的整数倍的判断,如 ...

  7. 那些年uniapp踩过的坑之-------搜索框插件uni-search-bar字体和图标居中的问题

    用uniapp必不可少的就是搜索框 但是公司要求的是这样滴 但是 uni-search-bar这个插件给我的偏偏是这样子滴 这个时候我以为是简简单单的样式问题,但是多方调试无果之后才发现,这两个根本不 ...

  8. 【深入理解TcaplusDB技术】扫描数据接口说明——[List表]

    摘要 实现扫描指定表格中的数据. 示例代码 同步调用参见章节:[List表]扫描数据示例代码. 异步调用参见章节:[List表]异步扫描数据示例代码. Client对象方法说明 注:如有未列出来的Cl ...

  9. MySQL基础合集

     我的小站 1.MySQL的优势 运行速度快 使用成本低 可移植性强 适用用户广 2.MySQL的运行机制 一个SQL语句,如select * from tablename ,从支持接口进来后,进入连 ...

  10. Jqgrid 动态设置cell disabled

    $($(grid2.jqGrid("getGridRowById", i + 1))[0].children).each(function (childI, childO) { i ...