前言

大家好,这里是白泽。《Go语言的100个错误以及如何避免》是最近朋友推荐我阅读的书籍,我初步浏览之后,大为惊喜。就像这书中第一章的标题说到的:“Go: Simple to learn but hard to master”,整本书通过分析100个错误使用 Go 语言的场景,带你深入理解 Go 语言。

我的愿景是以这套文章,在保持权威性的基础上,脱离对原文的依赖,对这100个场景进行篇幅合适的中文讲解。所涉内容较多,总计约 8w 字,这是该系列的第七篇文章,对应书中第55-60个错误场景。

当然,如果您是一位 Go 学习的新手,您可以在我开源的学习仓库中,找到针对《Go 程序设计语言》英文书籍的配套笔记,其他所有文章也会整理收集在其中。

B站:白泽talk,公众号【白泽talk】,聊天交流群:622383022,原书电子版可以加群获取。

前文链接:

8. 并发基础

章节概述

  • 理解并发和并行
  • 为什么并发并不总是更快
  • cup 负载和 io 负载的影响
  • 使用 channel 对比使用互斥锁
  • 理解数据竞争和竞态条件的区别
  • 使用 Go context

8.1 混淆并发与并行的概念(#55)

以一家咖啡店的运作为例讲解一下并发和并行的概念。

  • 并行:强调执行,如两个咖啡师同时在给咖啡拉花
  • 并发:两个咖啡师竞争一个咖啡研磨机器的使用

8.2 认为并发总是更快(#56)

  • 线程:OS 调度的基本单位,用于调度到 CPU 上执行,线程的切换是一个高昂的操作,因为要求将当前 CPU 中运行态的线程上下文保存,切换到可执行态,同时调度一个可执行态的线程到 CPU 中执行。
  • 协程:线程由 OS 上下文切换 CPU 内核,而 Goroutine 则由 Go 运行时上下文切换协程。Go 协程占用内存比线程少(2KB/2MB),协程的上下文切换比线程快80~90%。

GMP 模型:

  • G:Goroutine

    • 执行态:被调度到 M 上执行
    • 可执行态:等待被调度
    • 等待态:因为一些原因被阻塞
  • M:OS thread
  • P:CPU core
    • 每个 P 有一个本地 G 队列(任务队列)
    • 所有 P 有一个公共 G 队列(任务队列)

协程调度规则:每一个 OS 线程(M)被调度到 P 上执行,然后每一个 G 运行在 M 上。

上图中展示了一个4核 CPU 的机器调度 Go 协程的场景:

此时 P2 正在闲置因为 M3 执行完毕释放了对 P2 的占用,虽然 P2 的 Local queue 中已经空了,没有 G 可以调度执行,但是每隔一定时间,Go runtime 会去 Global queue 和其他 P 的 local queue 偷取一些 G 用于调度执行(当前存在6个可执行的G)。

特别的,在 Go1.14 之前,Go 协程的调度是合作形式的,因此 Go 协程发生切换的只会因为阻塞等待(IO/channel/mutex等),但 Go1.14 之后,运行时间超过 10ms 的协程会被标记为可抢占,可以被其他协程抢占 P 的执行。

为了印证有时候多协程并不一定会提高性能,这里以归并排序为例举三个例子:

示例一:

  1. func sequentialMergesort(s []int) {
  2. if len(s) <= 1 {
  3. return
  4. }
  5. middle := len(s) / 2
  6. sequentialMergesort(s[:middle])
  7. sequentialMergesort(s[middle:])
  8. merge(s, middle)
  9. }
  10. func merge(s []int, middle int) {
  11. // ...
  12. }

示例二:

  1. func sequentialMergesortV1(s []int) {
  2. if len(s) <= 1 {
  3. return
  4. }
  5. middle := len(s) / 2
  6. var wg sync.WaitGroup()
  7. wg.Add(2)
  8. go func() {
  9. defer wd.Done()
  10. parallelMergesortV1(s[:middle])
  11. }()
  12. go func() {
  13. defer wd.Done()
  14. parallelMergesortV1(s[middle:])
  15. }()
  16. wg.Wait()
  17. merge(s, middle)
  18. }

示例三:

  1. const max = 2048
  2. func sequentialMergesortV2(s []int) {
  3. if len(s) <= 1 {
  4. return
  5. }
  6. if len(s) < max {
  7. sequentialMergesort(s)
  8. } else {
  9. middle := len(s) / 2
  10. var wg sync.WaitGroup()
  11. wg.Add(2)
  12. go func() {
  13. defer wd.Done()
  14. parallelMergesortV2(s[:middle])
  15. }()
  16. go func() {
  17. defer wd.Done()
  18. parallelMergesortV2(s[middle:])
  19. }()
  20. wg.Wait()
  21. merge(s, middle)
  22. }
  23. }

由于创建协程和调度协程本身也有开销,第二种情况无论多少个元素都使用协程去进行并行排序,导致归并很少的元素也需要创建协程和调度,开销比排序更多,导致性能还比不上第一种顺序归并。

而在本台电脑上,经过调试第三种方式可以获得比第一种方式更优的性能,因为它在元素大于2048个的时候,选择并行排序,而少于则使用顺序排序。但是2048是一个魔法数,不同电脑上可能不同。这里这是为了证明,完全依赖并发/并行的机制,并不一定会提高性能,需要注意协程本身的开销。

8.3 分不清何时使用互斥锁或 channel(#57)

  • mutex:针对 G1 和 G2 这种并行执行的两个协程,它们可能会针对同一个对象进行操作,比如切片。此时是一个发生资源竞争的场景,因此适合使用互斥锁。
  • channel:而上游的 G1 或者 G2 中任何一个都可以在执行完自己逻辑之后,通知 G3 开始执行,或者传递给 G3 某些处理结果,此时使用 channel,因为 Go 推荐使用 channel 作为协程间通信的手段。

8.4 不理解竞态问题(#58)

数据竞争:多个协程同时访问一块内存地址,且至少有一次写操作。

假设有两个并发协程对 i 进行自增操作:

  1. i := 0
  2. go func() {
  3. i++
  4. }()
  5. go func() {
  6. i++
  7. }()

因为 i++ 操作可以被分解为3个步骤:

  1. 读取 i 的值
  2. 对应值 + 1
  3. 将值写会 i

当并发执行两个协程的时候,i 的最终结果是无法预计的,可能为1,也可能为2。

修正方案一:

  1. var i int64
  2. go func() {
  3. atomic.AddInt64(&i, 1)
  4. }()
  5. go func() {
  6. atomic.AddInt64(&i, 1)
  7. }()

使用 sync/atomic 包的原子运算,因为原子运算不能被打断,因此两个协程无法同时访问 i,因为客观上两个协程按顺序执行,因此最终的结果为2。

但是因为 Go 语言只为几种类型提供了原子运算,无法应对 slices、maps、structs。

修正方案二:

  1. i := 0
  2. mutex := sync.Mutex{}
  3. go func() {
  4. mutex.Lock()
  5. i++
  6. mutex.UnLock()
  7. }()
  8. go func() {
  9. mutex.Lock()
  10. i++
  11. mutex.UnLock()
  12. }()

此时被 mutex 包裹的部分,同一时刻只能允许一个协程访问。

修正方案三:

  1. i := 0
  2. ch := make(chan int)
  3. go func() {
  4. ch <- 1
  5. }
  6. go func() {
  7. ch <- 1
  8. }
  9. i += <-ch
  10. i += <-ch

使用阻塞的 channel,主协程必须从 ch 中读取两次才能执行结束,因此结果必然是2。

Go 语言的内存模型

我们使用 A < B 表示事件 A 发生在事件 B 之前。

  1. i := 0
  2. go func() {
  3. i++
  4. }()

因为创建协程发生在协程的执行,因此读取变量 i 并给 i + 1在这个例子中不会造成数据竞争。

  1. i := 0
  2. go func() {
  3. i++
  4. }()
  5. fmt.Println(i)

协程的退出无法保证一定发生在其他事件之前,因此这个例子会发生数据竞争。

  1. i := 0
  2. ch := make(chan struct{})
  3. go func() {
  4. <-ch
  5. fmt.Println(i)
  6. }()
  7. i++
  8. ch <- struct{}{}

这个例子由于打印 i 之前,一定会执行 i++ 的操作,并且子协程等待主协程的 channel 的解除阻塞信号。

  1. i := 0
  2. ch := make(chan struct{})
  3. go func() {
  4. <-ch
  5. fmt.Println(i)
  6. }()
  7. i++
  8. close()

和上一个例子有点像,channel 在关闭事件发生在从 channel 中读取信号之前,因此不会发生数据竞争。

  1. i := 0
  2. ch := make(chan struct{}, 1)
  3. go func() {
  4. i = 1
  5. <-ch
  6. }()
  7. ch <- struct{}{}
  8. fmt.Println(i)

主协程向 channel 放入值的操作执行,并不能确保与子协程的执行事件顺序,因此会发生数据竞争。

  1. i := 0
  2. ch := make(chan struct{})
  3. go func() {
  4. i = 1
  5. <-ch
  6. }()
  7. ch <- struct{}{}
  8. fmt.Println(i)

主协程的存入 channel 的事件,必然发生在子协程从 channel 取出事件之前,因此不会发生数据竞争。

  1. i := 0
  2. ch := make(chan struct{})
  3. go func() {
  4. i = 1
  5. <-ch
  6. }()
  7. ch <- struct{}{}
  8. fmt.Println(i)

无无缓冲的 channel 确保在主协程执行打印事件之前,必须会执行 i = 1 的赋值操作,因此不会发生数据竞争。

8.5 不了解工作负载类型对并发性能的影响(#59)

工作负载执行时间受到下述条件影响:

  • CPU 执行速度:例如执行归并排序,此时工作负载称作——CPU约束。
  • IO 执行速度:对DB进行查询,此时工作负载称作——IO约束。
  • 可用内存:此时工作负载称作——内存约束。

接下来通过一个场景讲解为何讨论并发性能,需要区分负载类型:假设有一个 read 函数,从循环中每次读取1024字节,然后将获得的内容传递给一个 task 函数执行,返回一个 int 值,并每次循环对这个 int 进行求和。

串行实现:

  1. func read(r io.Reader) (int, error) {
  2. count := 0
  3. for {
  4. b := make([]byte, 1024)
  5. _, err := r.Read(b)
  6. if err != nil {
  7. if err == io.EOF {
  8. break
  9. }
  10. return 0, err
  11. }
  12. count += task(b)
  13. }
  14. return count, nil
  15. }

并发实现:Worker pooling pattern(工作池模式)是一种并发设计模式,用于管理一组固定数量的工作线程(worker threads)。这些工作线程从一个共享的工作队列中获取任务,并执行它们。这个模式的主要目的是提高并发性能,通过减少线程的创建和销毁,以及通过限制并发执行的任务数量来避免资源竞争。

  1. func read(r io.Reader) (int, error) {
  2. var count int64
  3. wg := sync.WaitGroup{}
  4. var n = 10
  5. ch := make(chan []byte, n)
  6. wg.Add(n)
  7. for i := 0; i < n; i++ {
  8. go func() {
  9. defer wg.Done()
  10. for b := range ch {
  11. v := tasg(b)
  12. atomic.AddInt64(&count, int64(v))
  13. }
  14. }()
  15. }
  16. for {
  17. b := make([]byte, 1024)
  18. ch <- b
  19. }
  20. close(ch)
  21. wg.Wait()
  22. return int(count), nil
  23. }

这个例子中,关键在于如何确定 n 的大小:

  • 如果工作负载被 IO 约束:则 n 取决于外部系统,使得系统获得最大吞吐量的并发数。
  • 如果工作负载被 CPU 约束:最佳实践是取决于 GOMAXPROOCS,这是一个变量存放系统允许分配给执行协程的最大线程数量,默认情况下,这个变量用于设置逻辑 CPU 的数量,因为理想状态下,只能允许最大线程数量的协程同时执行,

8.6 不懂得使用 Go contexts(#60)

A Context carries a deadline, a cancellation signal, and other values across API boundaries.

截止时间

  • time.Duration(250ms)
  • time.Time(2024-02-28 00:00:00 UTC)

当截止时间到达的时候,一个正在执行的行为将停止。(如IO请求,等待从 channel 中读取消息)

假设有一个雷达程序,每隔四秒钟,向其他应用提供坐标坐标信息,且只关心最新的坐标。

  1. type publisher interface {
  2. Publish(ctx context.Content, position flight.Position) error
  3. }
  4. type publishHandler struct {
  5. pub publisher
  6. }
  7. func (h publishHandler) publishPosition(position flight.Position) error {
  8. ctx, cancel := context.WithTimeout(context.Background(), 4*time.Second)
  9. defer cancel()
  10. return h.pub.Publish(ctx, position)
  11. }

通过上述代码,创建一个过期时间4秒中的 context 上下文,则应用可以通过判断 ctx.Done() 判断这个上下文是否过期或者被取消,从而判断是否为4秒内的有效坐标。

cancel() 在 return 之前调用,则可以通过 cancel 方法关闭上下文,避免内存泄漏。

取消信号

  1. func main() {
  2. ctx. cancel := context.WithCancel(context.Background())
  3. defer cacel()
  4. go func() {
  5. CreateFileWatcher(ctx, "foo.txt")
  6. }()
  7. }

在 main 方法执行完之前,通过调用 cancel 方法,将 ctx 的取消信号传递给 CreateFileWatcher() 函数。

上下文传递值

  1. ctx := context.WithValue(context.Background(), "key", "value")
  2. fmt.Println(ctx.Value("key"))
  3. # value

key 和 value 是 any 类型的。

  1. package provider
  2. type key string
  3. const myCustomKey key = "key"
  4. func f(ctx context.Context) {
  5. ctx = context.WithValue(ctx, myCustomKey, "foo")
  6. // ...
  7. }

为了避免两个不同的 package 对同一个 ctx 存入同样的 key 导致冲突,可以将 key 设置成不允许导出的类型。

一些用法:

  1. 在借助 ctx 在函数之间传递同一个 id,实现链路追踪。
  2. 借助 ctx 在多个中间件之间传递,存放处理信息。
  1. type key string
  2. const inValidHostKey key = "isValidHost"
  3. func checkValid(next http.Handler) http.Handler {
  4. return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {
  5. validHost := r.Host == "came"
  6. ctx := context.WithValue(r.Context(), inValidHostKey, validHost)
  7. next.ServeHTTP(w, r.WithContext(ctx))
  8. })
  9. }

checkValid 作为一个中间件,优先处理 http 请求,将处理结果存放在 ctx 中,传递给下一个处理步骤。

捕获 context 取消

context.Context 类型提供了一个 Done 方法,返回了一个接受关闭信号的 channel:<-chan struct{},触发条件如下:

  • 如果 ctx 通过 context.WithCancel 创建,则可以通过 cancel 函数关闭。
  • 如果 ctx 通过 context.WithDeadline 创建,当过期的时候 channel 关闭。

此外,context.Context 提供了一个 Err 方法,将返回导致 channel 关闭的原因,如果没有关闭,调用则返回 nil。

  • 返回 context.Canceled error 如果 channel 被 cancel 方法关闭。
  • 返回 context.DeadlineExceeded 如果达到 deadline 过期。
  1. func handler(ctx context.Context, ch chan Message) error {
  2. for {
  3. select {
  4. case msg := <-ch:
  5. // Do something with msg
  6. case <-ctx.Done():
  7. return ctx.Err()
  8. }
  9. }
  10. }

小结

你已完成《Go语言的100个错误》全书学习进度60%,欢迎追更。

Go语言的100个错误使用场景(55-60)|并发基础的更多相关文章

  1. 黑马程序员——经典C语言程序设计100例

    1.数字排列 2.奖金分配问题 3.已知条件求解整数 4.输入日期判断第几天 5.输入整数进行排序 6.用*号显示字母C的图案 7.显示特殊图案 8.打印九九口诀 9.输出国际象棋棋盘 10.打印楼梯 ...

  2. C 语言经典100例

    C 语言经典100例 C 语言练习实例1 C 语言练习实例2 C 语言练习实例3 C 语言练习实例4 C 语言练习实例5 C 语言练习实例6 C 语言练习实例7 C 语言练习实例8 C 语言练习实例9 ...

  3. C语言打印100以内的质数

    C语言打印100以内的质数 #include <stdio.h> int main() { int number; int divisor; for( number = 3; number ...

  4. C语言经典100例(1-50)

    [程序1] 题目:有1.2.3.4个数字,能组成多少个互不相同且无重复数字的三位数?都是多少? 分析:可填在百位.十位.个位的数字都是1.2.3.4.组成所有的排列后再去掉不满足条件的排列. main ...

  5. C语言经典100例-ex002

    系列文章<C语言经典100例>持续创作中,欢迎大家的关注和支持. 喜欢的同学记得点赞.转发.收藏哦- 后续C语言经典100例将会以pdf和代码的形式发放到公众号 欢迎关注:计算广告生态 即 ...

  6. C语言经典100例-ex001

    系列文章<C语言经典100例>持续创作中,欢迎大家的关注和支持. 喜欢的同学记得点赞.转发.收藏哦- 后续C语言经典100例将会以pdf和代码的形式发放到公众号 欢迎关注:计算广告生态 即 ...

  7. Python重写C语言程序100例--Part1

    ''' [程序1] 题目:有1.2.3.4个数字,能组成多少个互不同样且无反复数字的三位数?都是多少? 1.程序分析:可填在百位.十位.个位的数字都是1.2.3.4.组成全部的排列后再去 掉不满足条件 ...

  8. C语言经典100例【1、2】

    [1]三位数字重组问题 题目:有 1.2.3.4 四个数字,能组成多少个互不相同且无重复数字的三位数?都是多少? 分析:分别把1,2,3,4放在个位.十位和百位,用嵌套循环即可解决.注意要求无重复数字 ...

  9. 题目:企业发放的奖金根据利润提成。 利润(I)低于或等于10万元时,奖金可提10%; 利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可可提成7.5%; 20万到40万之间时,高于20万元的部分,可提成5%; 40万到60万之间时高于40万元的部分,可提成 3%; 60万到100万之间时,高于60万元的部分,可提成1.5%; 高于100万元时,超过

    题目:企业发放的奖金根据利润提成. 利润(I)低于或等于10万元时,奖金可提10%: 利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可可提成7.5%: 20万到 ...

  10. 代码实现:企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%; 利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可可提成7.5%; 20万到40万之间时,高于20万元的部分,可提成5%;40万到60万之间时高于40万元的部分,可提成3%; 60万到100万之间时,高于60万元的部分,可提成1.5%,高于100万元时,超过100万元

    import java.util.Scanner; /* 企业发放的奖金根据利润提成.利润(I)低于或等于10万元时,奖金可提10%: 利润高于10万元,低于20万元时,低于10万元的部分按10%提成 ...

随机推荐

  1. 慢SQL的致胜法宝

    大促备战,最大的隐患项之一就是慢SQL,对于服务平稳运行带来的破坏性最大,也是日常工作中经常带来整个应用抖动的最大隐患,在日常开发中如何避免出现慢SQL,出现了慢SQL应该按照什么思路去解决是我们必须 ...

  2. css 动画 div顺时针方向移动,

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  3. css hover频繁闪烁

    今天遇见一个问题. 在鼠标放上 图片上的时候. 删除图标一直不停的闪烁. 我当时觉得很奇怪,父子关系的结构 不应该闪烁呀. 看了下html和css,发现子元素(要hover)的元素是绝对定位了的 于是 ...

  4. 加速tortoisegit的show log,减少等待时间

    KMSID: 81703 是否同步到KM: 是 是否原创: 是 标签: 游戏开发 允许复制: 是 允许评论: 是 允许导出PDF: 是 职业库分类KMS: 游戏-游戏程序 查看权限KMS:网易正式员工 ...

  5. 7.5 通过API判断进程状态

    进程状态的判断包括验证进程是否存在,实现方法是通过枚举系统内的所有进程信息,并将该进程名通过CharLowerBuff转换为小写,当转换为小写模式后则就可以通过使用strcmp函数对比,如果发现继承存 ...

  6. 3.1 DLL注入:常规远程线程注入

    动态链接库注入技术是一种特殊的技术,它允许在运行的进程中注入DLL动态链接库,从而改变目标进程的行为.DLL注入的实现方式有许多,典型的实现方式为远程线程注入,该注入方式的注入原理是利用了Window ...

  7. CE修改器入门:运用代码注入

    从本关开始,各位会初步接触到CE的反汇编功能,这也是CE最强大的功能之一.在第6关的时候我们说到指针的找法,用基址定位动态地址.但这一关不用指针也可以进行修改,即使对方是动态地址,且功能更加强大. 代 ...

  8. Axure谷歌浏览器扩展程序下载及安装方法(免FQ)

    在用Axure在chrome查看原型时,没有安装Axure谷歌浏览器插件时无法显示会有提示信息,如果未FQ按照提示是无法直接安装扩展程序的,这里提供插件下载地址并教大家如何安装插件. 平时在使用谷歌浏 ...

  9. Linux系统NTP配置同步修改硬件时钟

    前言: 硬件时钟:即BIOS时间,就是CMOS设置时看到的时间,存储在主板BIOS里,关机及断电后由主板电池供电维持时间的守时.    系统时钟:linux系统Kernel时间,由CPU守时,关机及断 ...

  10. mybatis批量插入支持默认值和自定义id生成策略的免写sql插件

    最近做项目时用了免写sql的插件但是发现批量操作不满足现有需求.所以,在原有基础之上扩展了批量的操作支持[支持插入默认值和自定义id生成策略].使用方法如下: 一:在pom文件中引入jar配置 < ...