深入理解Go语言(08):sync.WaitGroup源码分析
一、sync.WaitGroup简介
1.1 sync.WaitGroup 解决了什么问题
在编程的时候,有时遇到一个大的任务,为了提高计算速度,会用到并发程序,把一个大的任务拆分成几个小的独立的任务各自执行,因为这几个小任务相互没有关系,可以独立执行,这时候就可以用 Go 协程来处理这种并发任务。
但是这里会有一个问题,协程的调度器调度主 goroutine 和子 goroutine 时,机会是均等的,万一主 goroutine 运行完了,子 goroutine 还没运行完,程序就结束了。子任务没执行完程序结束,这种程序就有 bug,怎么解决这种问题?能不能让所有的子 goroutine 执行完,在让主程序结束从而让程序顺利执行完。这时候,sync.WaitGroup 就出场了。
sync.WaitGroup() 可以等待一组 goroutine 执行完再让剩下的程序执行完。
waitgroup 就是解决 go 中并发时,多个 goroutine 同步的问题。
1.2 用法
一般用法:
- 主 goroutine 通过调用 Add(i) 来设置需要等待的子 goroutine 数量,i 表示子 goroutine 数量。
- 子 goroutine 通过调用 Done() 来表示子 goroutine 执行完毕,goroutine 数量就减一,Add(-1)。
- 主 goroutine 通过调用 Wait() 来等待所有的子 goroutine 执行完毕。
一个小demo:
package main
import (
"fmt"
"sync"
)
func main() {
var wg sync.WaitGroup
wg.Add(2)
go func() {
defer wg.Done()
fmt.Println("子 goroutine1")
}()
go func() {
defer wg.Done()
fmt.Println("子 goroutine2")
}()
wg.Wait() // 等待所有的子goroutine结束
fmt.Println("程序运行结束")
}
程序运行输出:
子 goroutine2
子 goroutine1
程序运行结束
二、waitgroup源码分析
go1.17.10
2.1 数据结构WaitGroup
//https://github.com/golang/go/blob/go1.17.10/src/sync/waitgroup.go
// A WaitGroup waits for a collection of goroutines to finish.
// The main goroutine calls Add to set the number of
// goroutines to wait for. Then each of the goroutines
// runs and calls Done when finished. At the same time,
// Wait can be used to block until all goroutines have finished.
//
// A WaitGroup must not be copied after first use.
type WaitGroup struct {
noCopy noCopy
// 64-bit value: high 32 bits are counter, low 32 bits are waiter count.
// 64-bit atomic operations require 64-bit alignment, but 32-bit
// compilers do not ensure it. So we allocate 12 bytes and then use
// the aligned 8 bytes in them as state, and the other 4 as storage
// for the sema.
state1 [3]uint32
}
- 第一个字段:noCopy
Go 源码中检测禁止复制的技术。这种写法(noCopy)告诉 go vet 检测工具,如果有复制行为,那么就违反了复制使用的规则。
进一步解释下,如果在程序中,有对 WaitGroup 赋值的行为,那么 go vet 会检测,发现它并报错违反了复制使用的规则,但是 noCopy 并不会影响程序正常编译和运行。这是 Go 语言中的一个小 trick。
- 第二个字段:state1 数组
这个字段由 3 个数组组成,每个数组大小占 32 bits。一个字段就包含了 WaitGroup 中使用到的 3 种数据 - counter、waiter、semaphore(信号量)。而且还兼容 64 位系统和 32 位系统中的内存对齐,内存对齐的好处是加快 CPU 对内存的访问。内存对齐在 64 位系统中,变量一般占据 64 位(8 byte),对齐就是指变量的起始地址是 8 的倍数。在 32 位系统中,变量一般占据 32 位(4 byte),对齐就是指变量的起始地址是 4 的倍数。
它怎么包含 3 种数据,是怎么做到的?程序注释有解释:
- 64 位系统中:state1[0] 是 counter 计数器,state1[1] 是 waiter 计数器,state1[2] 就是 semaphore。
- 32 位系统中:state1[0] 是 semaphore,state1[1] 是 counter 计数器,state1[2] 就是 waiter 计数器。
counter、waiter、semaphore 说明:
counter:计算协程 goroutine 个数的计数器,表示当前要执行的 goroutine 个数。waitgroup 中的函数 Add(i),counter = counter + i;函数 Done(),counter - 1。
waiter:等待协程 goroutine 的计数器,表示当前已经调用 Wait() 函数的 goroutine-group 个数,也就是需要结束的goroutine组数。waitgroup 中的 Wait(),waiter + 1,并挂起当前 goroutine。
semaphore:go runtime 内部信号量实现。waitgroup 中会用到 semaphore 的两个相关函数,runtime_Semacquire 和 runtime_Semrelease。
runtime_Semacquire 表示增加一个信号量,并挂起当前 goroutine。
runtime_Semrelease 表示减少一个信号量,并唤醒 semaphore 上其中一个正在等待的 goroutine。
A. 字段 state1 设计的技巧:
在 32 位系统中,内存对齐时,可以把数组第 1 位 state1[0] 作为对齐的 padding,因为 state1 本身是 uint32 的数组,所以数组第一位也有 32 位。这样就保证了把数组后两位看做统一的 64 位整数时是64位对齐的。
只改变 semaphore 的位置顺序,就既可以保证 counter+waiter 一定会 64 位对齐,也可以保证内存的高效利用。
B. 信号量是什么?
前面提到了信号量 semaphore,下面简单了解下:
信号量是unix/linux系统提供的一种保护共享资源的机制,用于防止多个线程同时访问某个资源。它本质上是一个计数器。
信号量包含一个非负整型的变量,有两个原子操作 wait(down) 和 signal(up)。wait 又可以称为 P 或 down 操作,减 1 操作;signal 也被称为 V 或 up 操作,加 1 操作。信号量通过原子操作实现的 加 1
或 减 1
运算来实现对并发资源的控制。
wait(down) 操作,如果信号量的非负整型变量 S > 0,wait 将其减 1;如果 S = 0,wait 将该线程阻塞。
signal(up) 操作,如果有线程在信号量上阻塞(此时 S = 0),signal 会解除对某个等待线程的阻塞,恢复运行;如果没有线程阻塞在信号量上,signal 将 S 加 1。
S 可以理解为资源的数量,信号量即是通过控制资源数量加减来实现并发的互斥和同步。
内核信号量 struct semaphore ,包含 3 个字段:
count - 存放 atomic_t 类型的值,表示资源的数量。
wait - 存放等待队列链表的地址,当前等待资源的所有睡眠进程都放在这个链表中。如果 count 大于0或等于0,等待队列为空。
sleepers - 存放一个标识,表示是否有一些进程在信号量上睡眠。
更多关于信号量知识,请去查看 linux 内核相关内容。
2.2 state()-从state1中取变量:
WaitGroup struct 中的字段 state1 里面包含 3 种数据变量,怎么取出来呢?看下面的函数 state():
// https://github.com/golang/go/blob/go1.17.10/src/sync/waitgroup.go#L31
// state returns pointers to the state and sema fields stored within wg.state1.
// 得到state的地址和信号量的地址
func (wg *WaitGroup) state() (statep *uint64, semap *uint32) {
if uintptr(unsafe.Pointer(&wg.state1))%8 == 0 {
// 如果地址是64bit对齐,数组前两个元素组成state,后一个元素是信号量
return (*uint64)(unsafe.Pointer(&wg.state1)), &wg.state1[2]
} else {
// 如果地址是32bit对齐,数组后两个元素组成state,第一个元素32bit就是信号量
return (*uint64)(unsafe.Pointer(&wg.state1[1])), &wg.state1[0]
}
}
第一步,判断是 32 位 还是 64 位系统:
Golang 中判断当前变量是 32 位对齐还是 64 位对齐:https://go.dev/ref/spec#System_considerations,
uintptr(unsafe.Pointer(&x)) % unsafe.Alignof(x) == 0
第二步,取出相应的数据
64位对齐:数组 state1 的 state[0] 是 counter 计数,state[2] 是信号量
(*uint64)(unsafe.Pointer(&wg.state1)), &wg.state1[2]
32位对齐:数组 state1 的 state[0] 是信号量,state[1] 是 counter 计数
(*uint64)(unsafe.Pointer(&wg.state1[1])), &wg.state1[0]
2.3 Add()-计数器
Add(delta int) 函数用来增加计数器的值,要运行的协程数量,它把 delta 值累加到 counter 中。二就是释放信号量。
在程序中,delta 可以为负值,也就是 counter 值可能变成 0 或者 负值,当 counter = 0,waiter 就释放相等数量的信号量,把等待的 goroutine 全部唤醒。如果 counter < 0 负值了, 就 panic 报错。
下面看看代码,去掉 go runtime 里相关竞态代码,
// https://github.com/golang/go/blob/go1.17.10/src/sync/waitgroup.go#L53
func (wg *WaitGroup) Add(delta int) {
statep, semap := wg.state() // 获取state(counter+waiter)和semaphore信号量的指针
... ...
// uint64(delta)<<32 把 delta 左移32位,因为counter在statep的高32位
// 然后把delta原子的增加到counter中
state := atomic.AddUint64(statep, uint64(delta)<<32)
// v => counter, w => waiter
v := int32(state >> 32)//获取counter值
w := uint32(state) //获取waiter值
... ...
//counter变为负值了,panic报错
if v < 0 {
panic("sync: negative WaitGroup counter")
}
//waiter不等于0,说明已经执行了waiter,这时你又调用Add(),是不允许的
if w != 0 && delta > 0 && v == int32(delta) {
panic("sync: WaitGroup misuse: Add called concurrently with Wait")
}
//v->counter,counter>0,说明还有goroutine没执行完,不需要释放信号量,直接返回
//w->waiter, waiter=0,没有等待的goroutine,不需要释放信号量,直接返回
if v > 0 || w == 0 {
return
}
// This goroutine has set counter to 0 when waiters > 0.
// Now there can't be concurrent mutations of state:
// - Adds must not happen concurrently with Wait,
// - Wait does not increment waiters if it sees counter == 0.
// Still do a cheap sanity check to detect WaitGroup misuse.
// Add()和Wait()不能并行操作
// counter==0,也不能执行Wait()操作
if *statep != state {
panic("sync: WaitGroup misuse: Add called concurrently with Wait")
}
*statep = 0 // 结束了将counter清零,下面在释放waiter数的信号量
for ; w != 0; w-- {// 循环释放waiter个数的信号量
runtime_Semrelease(semap, false, 0)// 一次释放一个信号量,唤醒一个等待者
}
}
2.4 Done()
// https://github.com/golang/go/blob/go1.17.10/src/sync/waitgroup.go#L97
// Done decrements the WaitGroup counter by one.
func (wg *WaitGroup) Done() {
wg.Add(-1)
}
Done() 函数直接调用Add(),然后传入 -1 参数,将计数器减 1。
2.5 Wait()
Wait() 函数代码,累加waiter数,增加信号量然后等待唤醒,
// https://github.com/golang/go/blob/go1.17.10/src/sync/waitgroup.go#L103
func (wg *WaitGroup) Wait() {
statep, semap := wg.state() //获取state(counter+waiter)和semaphore信号量的指针
... ...
for {// 死循环
state := atomic.LoadUint64(statep) //原子的获取state值
v := int32(state >> 32) // 获取counter值
w := uint32(state) //获取waiter值
if v == 0 {// counter=0,不需要wait直接返回
// Counter is 0, no need to wait.
if race.Enabled {
race.Enable()
race.Acquire(unsafe.Pointer(wg))
}
return
}
... ...
// Increment waiters count.
if atomic.CompareAndSwapUint64(statep, state, state+1) {// 使用CAS累加wiater
... ...
runtime_Semacquire(semap) //增加信号量,等待信号量唤醒
// 这时 *statep 还不等于 0,那么使用过程肯定有误,直接 panic
if *statep != 0 {
panic("sync: WaitGroup is reused before previous Wait has returned")
}
... ...
return
}
}
}
2.6 小结
源码分析完了,代码量虽然很少,但是在 WaitGroup 包中的代码做了很多异常情况判断,对它的使用做了限制和规范。看看使用WaitGroup 时注意事项:
Add() 操作需要早于 Wait() 操作
调用 Done() 次数要与 Add() 计数器值相等
计数器 (counter) 的值小于 0,会 panic
Add() 和 Wait() 不能并行调用,比如在 2 个不同 goroutine 里调用,会 panic
要重复调用 WaitGroup,必须等 Wait() 执行完才能进行下一轮调用
三、参考
- https://zhuanlan.zhihu.com/p/344973865 Golang WaitGroup 深度剖析 作者:cyhone
- https://golang.design/under-the-hood/zh-cn/part1basic/ch05sync/waitgroup/ 作者:欧长坤
- https://github.com/golang/go/blob/go1.17.10/src/sync/waitgroup.go
深入理解Go语言(08):sync.WaitGroup源码分析的更多相关文章
- 《深入理解Spark:核心思想与源码分析》——SparkContext的初始化(叔篇)——TaskScheduler的启动
<深入理解Spark:核心思想与源码分析>一书前言的内容请看链接<深入理解SPARK:核心思想与源码分析>一书正式出版上市 <深入理解Spark:核心思想与源码分析> ...
- 《深入理解Spark:核心思想与源码分析》(前言及第1章)
自己牺牲了7个月的周末和下班空闲时间,通过研究Spark源码和原理,总结整理的<深入理解Spark:核心思想与源码分析>一书现在已经正式出版上市,目前亚马逊.京东.当当.天猫等网站均有销售 ...
- 《深入理解Spark:核心思想与源码分析》(第2章)
<深入理解Spark:核心思想与源码分析>一书前言的内容请看链接<深入理解SPARK:核心思想与源码分析>一书正式出版上市 <深入理解Spark:核心思想与源码分析> ...
- 《深入理解Spark:核心思想与源码分析》一书正式出版上市
自己牺牲了7个月的周末和下班空闲时间,通过研究Spark源码和原理,总结整理的<深入理解Spark:核心思想与源码分析>一书现在已经正式出版上市,目前亚马逊.京东.当当.天猫等网站均有销售 ...
- 《深入理解Spark:核心思想与源码分析》正式出版上市
自己牺牲了7个月的周末和下班空闲时间,通过研究Spark源码和原理,总结整理的<深入理解Spark:核心思想与源码分析>一书现在已经正式出版上市,目前亚马逊.京东.当当.天猫等网站均有销售 ...
- 深入理解分布式调度框架TBSchedule及源码分析
简介 由于最近工作比较忙,前前后后花了两个月的时间把TBSchedule的源码翻了个底朝天.关于TBSchedule的使用,网上也有很多参考资料,这里不做过多的阐述.本文着重介绍TBSchedule的 ...
- Go的WaitGroup源码分析
WaitGroup 是开发中经常用到的并发控制手段,其源代码在 src/sync/waitgroup.go 文件中,定义了 1 个结构体和 4 个方法: WaitGroup{}:结构体. state( ...
- 彻底理解红黑树及JavaJDK1.8TreeMap源码分析
1. 定义 红黑树也是二叉查找树,我们知道,二叉查找树这一数据结构并不难,而红黑树之所以难是难在它是自平衡的二叉查找树,在进行插入和删除等可能会破坏树的平衡的操作时,需要重新自处理达到平衡状态.红黑树 ...
- Go语言并发模型 G源码分析
Go 的线程实现模型,有三个核心的元素 M.P.G,它们共同支撑起了这个线程模型的框架.其中,G 是 goroutine 的缩写,通常称为 "协程".关于协程.线程和进程三者的异同 ...
- go中sync.Mutex源码解读
互斥锁 前言 什么是sync.Mutex 分析下源码 Lock 位运算 Unlock 总结 参考 互斥锁 前言 本次的代码是基于go version go1.13.15 darwin/amd64 什么 ...
随机推荐
- ESXi重置密码以及修改网络IP地址的方法
Study From https://www.cnblogs.com/mk21/p/15784082.html 前期公司有部分虚拟化的服务器因为只通过vCenter进行管理. 导致密码遗失. 最近因为 ...
- 可插拔组件设计机制—SPI
作者:京东物流 孔祥东 1.SPI 是什么? SPI 的全称是Service Provider Interface,即提供服务接口:是一种服务发现机制,SPI 的本质是将接口实现类的全限定名配置在文件 ...
- 【K哥爬虫普法】字节前高管,离职后入侵今日头条数据库,是阴谋、还是利诱?
案情介绍 2016年至2017年间,张洪禹.宋某.侯明强作为被告单位上海晟品网络科技有限公司主管人员,在上海市共谋采用技术手段抓取北京字节跳动网络技术有限公司(办公地点位于本市海淀区北三环西路43号中 ...
- 树状数组(区间修改&&区间查询)
#include<bits/stdc++.h> #define int long long using namespace std; int n,m,x,x1,y,z; int a[100 ...
- NLP文本匹配任务Text Matching 有监督训练:PointWise(单塔)、DSSM(双塔)、Sentence BERT(双塔)项目实践
NLP文本匹配任务Text Matching [有监督训练]:PointWise(单塔).DSSM(双塔).Sentence BERT(双塔)项目实践 0 背景介绍以及相关概念 本项目对3种常用的文本 ...
- C/C++ MinHook 库的使用技巧
在上面的各种Hook挂钩方式中,我们都是在手写封装代码,但这样的方式并不高效,真正的生产环境中我们必须使用现成的Hook库,常用的Hook库有免费开源的MinHook和商业的Detours Hook, ...
- LyScript 自实现汇编搜索功能
通过对LyScript自动化插件进行二次封装,实现从内存中读入目标进程解码后的机器码,并通过Python代码在这些机器码中寻找特定的十六进制字符数组,或直接检索是否存在连续的反汇编指令片段等功能. 插 ...
- 《IDEA Plugin 开发手册》• 小傅哥.pdf | 年前整理的最后一本PDF资料
作者:小傅哥 博客:https://bugstack.cn 沉淀.分享.成长,让自己和他人都能有所收获! 一.前言 为什么?写写快乐的热门文章不好吗! 从开始准备成体系的编写 IDEA Plugin ...
- CH9140,CH9141,CH9143异同点
9140:是一款蓝牙转串口芯片,芯片支持蓝牙主从一体模式或从机模式,支持蓝牙 BLE4.2.串口波特率最高 1Mbps,支持 MODEM 联络信号,蓝牙主从模式可以自动连接或绑定. 智能配对功能 当 ...
- ABC 317 A - G
ABC 317 A - G 代码去 Atcoder 全部提交搜索 Std_Code 查看代码 懒人专用 A $ p_i $ 升序,找最小的 $ i $ 满足 $ p_i + h \ge x $ 直接枚 ...