去年开始写文章的第一篇就是关于 defer,名字比较文艺:《Golang 之轻松化解 defer 的温柔陷阱》,还被吐槽了。因为这篇文章,到《Go 夜读》讲了一期。不过当时纯粹是应用层面的,也还没有跳进 Go 源码这个大坑,文章看着比较清新,也没有大段的源码解析。

自从听了曹大在《Go 夜读》分享的 Go 汇编,以及研读了阿波张的 Go 调度器源码分析的文章后,各种源码、汇编满天飞……

上次欧神写了一篇《Go GC 20 问》,全文也没有一行源码,整体读下来很畅快。今天这篇也来尝试一下这种写法,不过,我们先从一个小的主题开始:defer 链表是如何被遍历并执行的。

关于 defer 的源码分析文章,网络上也有很多。不过,很少有能完全说明白这个话题的,除了阿波张的。

我们知道,为了在退出函数前执行一些资源清理的操作,例如关闭文件、释放连接等。会在函数里写上多个 defer 语句,被 defered 的函数,以“先进后出”的顺序,在 RET 指令前得以执行。

在一条函数调用链中,多个函数中会出现多个 defer 语句。例如:a() -> b() -> c() 中,每个函数里都有 defer 语句,而这些 defer 语句会创建对应个数的 _defer 结构体,这些结构体以链表的形式挂在 goroutine 结构体下。看起来像这样:

在编译器的加持下,defer 语句会先调用 deferporc 函数,new 一个 _defer 结构体,挂到 g 上。当然,这里的 new 会优先从当前绑定的 P 的 defer pool 里取,没取到会去全局的 defer pool 里取,实在没有的话就新建一个,很熟悉的套路。

这样做好之后,等待函数体执行完,在 RET 指令之前(注意不是 return 之前),调用 deferreturn 函数完成 _defer 链表的遍历,执行完这条链上所有被 defered 的函数(如关闭文件、释放连接等)。这里的问题是在 deferreturn 函数的最后,会使用 jmpdefer 跳转到之前被 defered 的函数,这时控制权转移到了用户自定义的函数。这只是执行了一个被 defered 的函数,这条链上其他的被 defered 的函数,该如何得到执行呢?

答案就是控制权会再次交给 runtime,并再次执行 deferreturn 函数,完成 defer 链表的遍历。那这一切是如何完成的呢?

这就要从 Go 汇编的栈帧说起了。先看一个汇编函数的声明:

TEXT runtime·gogo(SB), NOSPLIT, $16-8

最后两个数字表示 gogo 函数的栈帧大小为 16B,即函数的局部变量和为调用子函数准备的参数和返回值需要 16B 的栈空间;参数和返回值的大小加起来是 8B。实际上 gogo 函数的声明是这样的:

// func gogo(buf *gobuf)

参数及返回值的大小是给调用者“看”的,调用者根据这个数字可以构造栈:准备好被调函数需要的参数及返回值。

典型的函数调用场景下参数布局图如下图:

左图中,主调函数准备好调用子函数的参数及返回值,执行 CALL 指令,将返回地址压入栈顶,相当于执行了 PUSH IP,之后,将 BP 寄存器的值入栈,相当于执行了 PUSH BP,再 jmp 到被调函数。

图中 return address 表示子函数执行完毕后,返回到上层函数中调用子函数语句的下一条要执行的指令,它属于 caller 的栈帧。而调用者的 BP 则属于被调函数的栈帧。

子函数执行完毕后,执行 RET 指令:首先将子函数栈底部的值赋到 CPU 的 BP 寄存器中,于是 BP 指向上层函数的 BP;再将 return address 赋到 IP 寄存器中,这时 SP 回到左图所示的位置。相当于还原了整个调用子函数的现场,像是一切都没发生过;接着,CPU 继续执行 IP 寄存器里的下一条指令。

再回到 defer 上来,其实在构造 _defer 结构体的时候,需要将当前函数的 SP、被 defered 的函数指针保存到 _defer 结构体中。并且会将被 defered 的函数所需要的参数 copy 到 _defer 结构体相邻的位置。最终在调用被 defered 的函数的时候,用的就是这时被 copy 的值,相当于使用了它的一个快照,如果此参数不是指针或引用类型的话,会产生一些意料之外的 bug。

最后,在 deferreturn 函数里,这些被 defered 的函数得以执行,_defer 链表也会被逐渐“消耗”完。

使用一个阿波张文章中的例子:

package main

import "fmt"

func sum(a, b int) {
c := a + b
fmt.Println("sum:" , c)
} func f(a, b int) {
defer sum(a, b) fmt.Printf("a: %d, b: %d\n", a, b)
} func main() {
a, b := 1, 2
f(a, b)
}

执行完 f 函数时,最终会进入 deferreturn 函数:

func deferreturn(arg0 uintptr) {
gp := getg()
d := gp._defer
if d == nil {
return
} ...... switch d.siz {
case 0:
// Do nothing.
case sys.PtrSize:
*(*uintptr)(unsafe.Pointer(&arg0)) = *(*uintptr)(deferArgs(d))
default:
memmove(unsafe.Pointer(&arg0), deferArgs(d), uintptr(d.siz)) // 移动参数
}
fn := d.fn
d.fn = nil
gp._defer = d.link
freedefer(d) _ = fn.fn
jmpdefer(fn, uintptr(unsafe.Pointer(&arg0)))
}

免不了还是要看一下代码,不然的话很难讲清楚。

因为我们是在遍历 _defer 链表,所以得有一个终止的条件:

d := gp._defer
if d == nil {
return
}

也就是当 _defer 链表为空的时候,终止遍历。在后面的代码里会看到,每执行完一个被 defered 的函数后,都会将 _defer 结构体从链表中删除并回收,所以 _defer 链表会越来越短。

switch 语句里要做的就是准备好被 defered 的函数(例子中就是 sum 函数)所需要的 a,b 两个 int 型参数。参数从哪来呢?从 _defer 结构体相邻的位置,还记得吗,这是在 deferproc 函数里 copy 过去的。deferArgs(d) 返回的就是当时 copy 的目的地址。那现在要拷贝到哪去呢?答案是:unsafe.Pointer(&arg0)。我们知道,arg0 是 deferreturn 函数的参数,我们又知道,在 Go 汇编中,一个函数的参数是由它的主调函数准备的。因此 arg0 的地址实际上就是它的上层函数(在这里就是 f 函数)的栈上放参数的位置。

函数的最后,通过 jmpdefer 跳转到被 defered 的 sum 函数:

jmpdefer(fn, uintptr(unsafe.Pointer(&arg0)))

核心在于 jmpdefer 所做的事:

TEXT runtime·jmpdefer(SB), NOSPLIT, $0-16
MOVQ fv+0(FP), DX // fn // defer 的函数的地址
MOVQ argp+8(FP), BX
LEAQ -8(BX), SP // caller sp after CALL
MOVQ -8(SP), BP // restore BP as if deferreturn returned (harmless if framepointers not in use)
SUBQ $5, (SP) // return to CALL again
MOVQ 0(DX), BX
JMP BX // but first run the deferred function

首先将 sum 函数的地址放到 DX 寄存器中,最后通过 JMP 指令去执行。

MOVQ	argp+8(FP), BX
LEAQ -8(BX), SP // caller sp after CALL // 执行 CALL 指令后 f 函数的栈顶

这两行实际上是调整了下当前 SP 寄存器的值,因为 argp+8(FP) 实际上是 jmpdefer 的第二个参数(它在 deferreturn 函数中),它指向 f 函数栈帧中的刚被 copy 过来的 sum 函数的参数。而 -8(BX) 就代表了 f 函数调用 deferreturn 的返回地址,实际上就是 deferreturn 函数的下一条指令地址。

接着,MOVQ -8(SP), BP 这条指令则重置了 BP 寄存器,使它指向了 f 栈帧 的 BP。这样,SP、BP 寄存器回到了 f 函数调用 deferreturn 之前的状态:f 刚准备好调用 deferreturn 的参数,并且把返回值压栈了。相当于抛弃了 deferreturn 函数的栈帧,不过,确实也没什么用了。

接着 SUBQ $5, (SP) 把返回地址减少了 5B,刚好是一个 CALL 指令的长度。什么意思?当执行完 deferreturn 函数之后,执行流程会返回到 CALL deferreturn 的下一条指令,将这个值减少 5B,也就又回到了 CALL deferreturn 指令,从而实现了“递归地”调用 deferreturn 函数的效果。当然,栈却不会在增长!

jmpdefer 函数的最后会执行 sum 函数,看起来就像是 f 函数亲自调用 sum 函数一样,参数、返回值都是就绪的。

等到 sum 函数执行完,执行流程就会跳转到 call deferreturn 指令处重新进入 deferreturn 函数,遍历完所有的 _defer 结构体,执行完所有的被 defered 的函数,才真正执行完 deferretrun 函数。

到这里,全文就结束了。我们可以看到,实现遍历 defer 链表的关键就是 jmpdefer 函数所做的一些“见不得人”的工作,将调用 deferreturn 函数的返回地址减少了 5 个字节,使得被 defered 的函数执行完后,又回到 CALL deferreturn 指令处,从而实现“递归地”调用 deferreturn 函数,完成 _defer 链表的遍历。

参考资料

【阿波张 defer 源码分析】https://mp.weixin.qq.com/s/iEtMbRXW4yYyCG0TTW5y9g

【阿波张 panic&recover】https://mp.weixin.qq.com/s/0JTBGHr-bV4ikLva-8ghEw

【阿波张 defer 基础】https://mp.weixin.qq.com/s/QmeQTONUuWlr_sRNP8b5Tw

【汇编分析】https://segmentfault.com/a/1190000019804120?utm_medium=referral&utm_source=tuicool

【曹大 Go 汇编分享】https://github.com/cch123/asmshare/blob/master/layout.md

【曹大 Go 汇编】https://xargin.com/plan9-assembly

【曹大利用汇编写的 goid 获取】https://github.com/cch123/goroutineid

defer 链如何被遍历的更多相关文章

  1. javascript中的对象,原型,原型链和面向对象

    一.javascript中的属性.方法 1.首先,关于javascript中的函数/“方法”,说明两点: 1)如果访问的对象属性是一个函数,有些开发者容易认为该函数属于这个对象,因此把“属性访问”叫做 ...

  2. 职责链模式(Chain of Responsibility)的Java实现

    职责链模式(Chain of Responsibility):使多个对象都有机会处理请求,从而避免请求的发送者和接收者之间的耦合关系.将这些对象连成一条链,并沿着这条链传递该请求,直到有一个对象处理它 ...

  3. PEB及LDR链

    PEB地址的取得在NT内核系统中fs寄存器指向TEB结构,TEB+0x30处指向PEB结构,PEB+0x0c处指向PEB_LDR_DATA结构,PEB_LDR_DATA+0x1c处存放一些指向动态链接 ...

  4. 设计模式之第13章-职责链模式(Java实现)

    设计模式之第13章-职责链模式(Java实现) “请假都那么麻烦,至于么.”“咋的了?”“这不快过年了么,所以我想早两天回去,准备一下,买买东西什么的,然后去给项目经理请假,但是他说快过年了,所以这个 ...

  5. 【PHP数据结构】图的遍历:深度优先与广度优先

    在上一篇文章中,我们学习完了图的相关的存储结构,也就是 邻接矩阵 和 邻接表 .它们分别就代表了最典型的 顺序存储 和 链式存储 两种类型.既然数据结构有了,那么我们接下来当然就是学习对这些数据结构的 ...

  6. jquery插件扩展的学习

    jquery插件的学习可以点击这里 举个例子 //首先先来一个插件 (function($){ $.fn.extent({ bigfont:function(){ return this.css('f ...

  7. 什么?你还不会写JQuery 插件

    前言 如今做web开发,jquery 几乎是必不可少的,就连vs神器在2010版本开始将Jquery 及ui 内置web项目里了.至于使用jquery好处这里就不再赘述了,用过的都知道.今天我们来讨论 ...

  8. 写JQuery 插件 什么?你还不会写JQuery 插件

    http://www.cnblogs.com/Leo_wl/p/3409083.html 前言 如今做web开发,jquery 几乎是必不可少的,就连vs神器在2010版本开始将Jquery 及ui ...

  9. RTTI的实现(vc)--转载

    RTTI (Run Time Type info) 这个神奇的东西用于存储类的相关信息,用于在运行时识别类对象的信息.C++ 里面只记录的类的名字和类的继承关系链.使得编译成二进制的代码,对象可以知道 ...

随机推荐

  1. Ubuntu全方位美化,定制教程

    Ubuntu全方位美化,定制教程 上一篇随笔聊了聊Linux图形界面的各种名词及其关系,解释了何为xserver,何为xclient,linux的图形界面是如何工作的,Linux图形软件的多样性.li ...

  2. Nginx笔记总结十七:nginx生成缩略图配置(http_image_filter_module)

    编译: ./configure --prefix=/usr/local/nginx --with-http_stub_status_module --with-http_realip_module-- ...

  3. IT男频繁猝死背后的心理探秘

    "深圳36岁IT男猝死酒店马桶上"这条新闻再次成为人们眼球的焦点,每每发生这样的事情,难免让人扼腕唏嘘,他们本该是风华正茂的年纪,家有老母贤妻爱子,甚至房子车子票子都不缺,该是一边 ...

  4. 题解:BZOJ 1009 HNOI2008 GT考试 KMP + 矩阵

    原题描述: 阿申准备报名参加GT考试,准考证号为N位数 X1X2....Xn(0<=Xi<=9),他不希望准考证号上出现不吉利的数字.他的不吉利数学A1A2...Am(0<=Ai&a ...

  5. tomcat启动后access error[730048]的解决方法

    安装了JDK... 配置了系统变量... 解压了tomcat... 配置了系统变量... 点击startup.bat启动了以后,打开浏览器,出现access error 404错误. 仔细看过控制台输 ...

  6. mvn -v报java.lang.ClassNotFoundException

    Tips: 比如要下载版本3.2.5的,请选择binaries下的apache-maven-3.2.5-bin.zip. binaries 指的是可以执行的. source 指的源码. 下载地址:ht ...

  7. 你相信吗:一加仑汽油可以给iPhone充电20年

    一直以来,苹果公司的iPhone系列手机受到了全世界人民的喜欢,很多人就此成为了果粉.或许是由于我们过于在意iPhone系列手机出彩的外形,所以忽略了很多关于iPhone手机有意思的消息,我们今天就来 ...

  8. Django ORM必会13条之外的查询方法

    基于双下划线的查询 # 价格 大于 小于 大于等于 小于等于 filter(price__gt=') # 筛选出大于90 filter(price__lt=') # 筛选出小于90 filter(pr ...

  9. Python学习笔记(四)函数式编程

    高阶函数(Higher-order function) Input: 1 abs Output: 1 <function abs> Input: 1 abs(-10) Output: 1 ...

  10. Vue.js——学习笔记(一)

    Vue-自学笔记 Vue (读音 /vjuː/,类似于 view) 是一套用于构建用户界面的渐进式框架.与其它大型框架不同的是,Vue 被设计为可以自底向上逐层应用.Vue 的核心库只关注视图层,不仅 ...