转：http://blog.csdn.net/kjfcpua/article/details/18265461

Go语言的并发和并行

不知道你有没有注意到一个现象，还是这段代码，如果我跑在两个goroutines里面的话:

var quit chan int = make(chan int)

func loop() {

    for i := 0; i < 10; i++ {

        fmt.Printf("%d ", i)

    }

    quit <- 0

}

func main() {

    // 开两个goroutine跑函数loop, loop函数负责打印10个数

    go loop()

    go loop()

    for i := 0; i < 2; i++ {

        <- quit

    }

}

我们观察下输出:

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9

这是不是有什么问题？?

以前我们用线程去做类似任务的时候，系统的线程会抢占式地输出，表现出来的是乱序地输出。而goroutine为什么是这样输出的呢？

goroutine是在并行吗？

我们找个例子测试下:

package main

import "fmt"

import "time"

var quit chan int

func foo(id int) {

    fmt.Println(id)

    time.Sleep(time.Second) // 停顿一秒

    quit <- 0 // 发消息：我执行完啦！

}

func main() {

    count := 1000

    quit = make(chan int, count) // 缓冲1000个数据

    for i := 0; i < count; i++ { //开1000个goroutine

        go foo(i)

    }

    for i :=0 ; i < count; i++ { // 等待所有完成消息发送完毕。

        <- quit

    }

}

让我们跑一下这个程序(之所以先编译再运行，是为了让程序跑的尽量快,测试结果更好):

go build test.go

time ./test

./test  0.01s user 0.01s system 1% cpu 1.016 total

我们看到，总计用时接近一秒。貌似并行了！

我们需要首先考虑下什么是并发, 什么是并行

并行和并发

从概念上讲，并发和并行是不同的, 简单来说看这个图片(原图来自这里)

两个队列，一个Coffee机器，那是并发
两个队列，两个Coffee机器，那是并行

更多的资料：并发不是并行, 当然Google上有更多关于并行和并发的区别。

那么回到一开始的疑问上，从上面的两个例子执行后的表现来看，多个goroutine跑loop函数会挨个goroutine去进行，而sleep则是一起执行的。

这是为什么？

默认地， Go所有的goroutines只能在一个线程里跑。

也就是说，以上两个代码都不是并行的，但是都是是并发的。

如果当前goroutine不发生阻塞，它是不会让出CPU给其他goroutine的, 所以例子一中的输出会是一个一个goroutine进行的，而sleep函数则阻塞掉了当前goroutine, 当前goroutine主动让其他goroutine执行, 所以形成了逻辑上的并行, 也就是并发。

真正的并行

为了达到真正的并行，我们需要告诉Go我们允许同时最多使用多个核。

回到起初的例子，我们设置最大开2个原生线程, 我们需要用到runtime包(runtime包是goroutine的调度器):

import (

    "fmt"

    "runtime"

)

var quit chan int = make(chan int)

func loop() {

    for i := 0; i < 100; i++ { //为了观察，跑多些

        fmt.Printf("%d ", i)

    }

    quit <- 0

}

func main() {

    runtime.GOMAXPROCS(2) // 最多使用2个核

    go loop()

    go loop()

    for i := 0; i < 2; i++ {

        <- quit

    }

}

这下会看到两个goroutine会抢占式地输出数据了。

我们还可以这样显式地让出CPU时间：

func loop() {

    for i := 0; i < 10; i++ {

        runtime.Gosched() // 显式地让出CPU时间给其他goroutine

        fmt.Printf("%d ", i)

    }

    quit <- 0

}

func main() {

    go loop()

    go loop()

    for i := 0; i < 2; i++ {

        <- quit

    }

}

观察下结果会看到这样有规律的输出:

0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9

其实，这种主动让出CPU时间的方式仍然是在单核里跑。但手工地切换goroutine导致了看上去的“并行”。

其实作为一个Python程序员，goroutine让我更多地想到的是gevent的协程，而不是原生线程。

关于runtime包对goroutine的调度，在stackoverflow上有一个不错的答案:http://stackoverflow.com/questions/13107958/what-exactly-does-runtime-gosched-do

一个小问题

我在Segmentfault看到了这个问题: http://segmentfault.com/q/1010000000207474

题目说，如下的程序，按照理解应该打印下5次 "world"呀，可是为什么什么也没有打印

package main

import (

    "fmt"

)

func say(s string) {

    for i := 0; i < 5; i++ {

        fmt.Println(s)

    }

}

func main() {

    go say("world") //开一个新的Goroutines执行

    for {

    }

}

楼下的答案已经很棒了，这里Go仍然在使用单核，for死循环占据了单核CPU所有的资源，而main线和say两个goroutine都在一个线程里面，所以say没有机会执行。解决方案还是两个：

允许Go使用多核(runtime.GOMAXPROCS)
手动显式调动(runtime.Gosched)

runtime调度器

runtime调度器是个很神奇的东西，但是我真是但愿它不存在，我希望显式调度能更为自然些，多核处理默认开启。

关于runtime包几个函数:

Gosched 让出cpu
NumCPU 返回当前系统的CPU核数量
GOMAXPROCS 设置最大的可同时使用的CPU核数
Goexit 退出当前goroutine(但是defer语句会照常执行)

总结

我们从例子中可以看到，默认的, 所有goroutine会在一个原生线程里跑，也就是只使用了一个CPU核。

在同一个原生线程里，如果当前goroutine不发生阻塞，它是不会让出CPU时间给其他同线程的goroutines的，这是Go运行时对goroutine的调度，我们也可以使用runtime包来手工调度。

本文开头的两个例子都是限制在单核CPU里执行的，所有的goroutines跑在一个线程里面，分析如下:

对于代码例子一（loop函数的那个），每个goroutine没有发生堵塞(直到quit流入数据), 所以在quit之前每个goroutine不会主动让出CPU，也就发生了串行打印
对于代码例子二（time的那个），每个goroutine在sleep被调用的时候会阻塞，让出CPU, 所以例子二并发执行。

那么关于我们开启多核的时候呢？Go语言对goroutine的调度行为又是怎么样的？

我们可以在Golang官方网站的这里找到一句话:

When a coroutine blocks, such as by calling a blocking system call, the run-time automatically moves other coroutines on the same operating system thread to a different, runnable thread so they won't be blocked.

也就是说:

当一个goroutine发生阻塞，Go会自动地把与该goroutine处于同一系统线程的其他goroutines转移到另一个系统线程上去，以使这些goroutines不阻塞

开启多核的实验

仍然需要做一个实验，来测试下多核支持下goroutines的对原生线程的分配, 也验证下我们所得到的结论“goroutine不阻塞不放开CPU”。

实验代码如下:

package main

import (

    "fmt"

    "runtime"

)

var quit chan int = make(chan int)

func loop(id int) { // id: 该goroutine的标号

    for i := 0; i < 10; i++ { //打印10次该goroutine的标号

        fmt.Printf("%d ", id)

    }

    quit <- 0

}

func main() {

    runtime.GOMAXPROCS(2) // 最多同时使用2个核

    for i := 0; i < 3; i++ { //开三个goroutine

        go loop(i)

    }

    for i := 0; i < 3; i++ {

        <- quit

    }

}

多跑几次会看到类似这些输出(不同机器环境不一样):

0 0 0 0 0 1 1 0 0 1 0 0 1 0 1 2 1 2 1 2 1 2 1 2 1 2 2 2 2 2

0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2

0 0 0 0 0 0 0 1 1 1 1 1 0 1 0 1 0 1 2 1 2 1 2 2 2 2 2 2 2 2

0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 2 0 2 0 2 2 2 2 2 2 2 2

0 0 0 0 0 0 0 1 0 0 1 0 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 2 2

执行它我们会发现以下现象:

有时会发生抢占式输出(说明Go开了不止一个原生线程，达到了真正的并行)
有时会顺序输出, 打印完0再打印1, 再打印2(说明Go开一个原生线程，单线程上的goroutine不阻塞不松开CPU)

那么，我们还会观察到一个现象，无论是抢占地输出还是顺序的输出，都会有那么两个数字表现出这样的现象:

一个数字的所有输出都会在另一个数字的所有输出之前

原因是， 3个goroutine分配到至多2个线程上，就会至少两个goroutine分配到同一个线程里，单线程里的goroutine 不阻塞不放开CPU, 也就发生了顺序输出。

评论：

回复：对于这个问题，我个人认为您对于go的scheduler如何在1个machine thead（物理线程）调度多个goroutine的理解是正确的，确实是：当一个goroutine一直在跑，不主动出让cpu（也没有io操作），按道理就会一直占据当前的物理线程。
但是，实际上并非如此，在不同的操作系统中，对于线程的调度算法是不一样的，特别是在linux系统中，有些操作系统会记录每个线程的运行时间，达到一定长度就会强制切换。并不是说一个有死循环的线程就可以一直占据一个cpu。

package main
import "fmt"
var quit chan int
func Print(ch string) {
for i := 0; i < 10000; i++ {
fmt.Print(ch)
}
quit <- 0
}
func main() {
quit = make(chan int, 2)
go Print("0")
go Print("1")
for i := 0; i < 2; i++ {
<- quit
}
fmt.Println("END")
}

可以看到01一定程度上交叉出现，说明了什么呢，go编译器在中间插入了调度代码？

回复nofreezou：好吧，突然我想到，fmt.Println也是一个io操作，可能里面切换到其他goroutine了- -|

Go语言并发与并行学习笔记(二)的更多相关文章

Go语言并发与并行学习笔记(一)
转:http://blog.csdn.net/kjfcpua/article/details/18265441 如果不是我对真正并行的线程的追求,就不会认识到Go有多么的迷人. Go语言从语言层面上就 ...
Go语言并发与并行学习笔记(三)
转:http://blog.csdn.net/kjfcpua/article/details/18265475 Go语言并发的设计模式和应用场景以下设计模式和应用场景来自Google IO上的关于G ...
Go语言学习笔记二：变量
Go语言学习笔记二: 变量今天又学了一招如何查看go的版本的命令:go version.另外上一个笔记中的代码还可以使用go run hello.go来运行,只是这种方式不会生成exe文件. 定义变 ...
AJax 学习笔记二(onreadystatechange的作用)
AJax 学习笔记二(onreadystatechange的作用) 当发送一个请求后,客户端无法确定什么时候会完成这个请求,所以需要用事件机制来捕获请求的状态XMLHttpRequest对象提供了on ...
NumPy学习笔记二
NumPy学习笔记二 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.<数学分 ...
python3.4学习笔记(二) 类型判断，异常处理，终止程序
python3.4学习笔记(二) 类型判断,异常处理,终止程序,实例代码: #idle中按F5可以运行代码 #引入外部模块 import xxx #random模块,randint(开始数,结束数) ...
JDBC学习笔记二
JDBC学习笔记二 4.execute()方法执行SQL语句 execute几乎可以执行任何SQL语句,当execute执行过SQL语句之后会返回一个布尔类型的值,代表是否返回了ResultSet对象 ...
Html学习笔记(二) 简单标签
标签的重点标签的用途标签在浏览器中的默认样式 <body>标签: 在网页上显示的内容 <p>标签: 添加段落 <hx>标签: 添加标题标签一共有6个,h1.h ...
WPF的Binding学习笔记(二)
原文: http://www.cnblogs.com/pasoraku/archive/2012/10/25/2738428.htmlWPF的Binding学习笔记(二) 上次学了点点Binding的 ...

随机推荐

git bash下的选择、复制、粘贴
1. 打开git bash 2.点击左上角,选择属性,打钩 3.回到界面,选择一行文字,然后点击 “右键”,这样就复制到剪切板了.再点 “右键”,可以粘贴到命令窗口中了.
Codeforces Round #286 (Div. 2) B. Mr. Kitayuta's Colorful Graph dfs
B. Mr. Kitayuta's Colorful Graph time limit per test 1 second memory limit per test 256 megabytes in ...
HDU1045 Fire Net（DFS）
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1045 Fire Net Time Limit: 2000/1000 MS (Java/Others) ...
git使用技巧
git使用技巧转载自:http://172.17.144.8/iceway.zhang/shares/201604/201604_git_tips.md.html 我们在工作中几乎每天都会用到git ...
linux GO语言配置安装
1.下载地址 https://golang.org/dl/ 2.解压解压到/usr/local/go目录下 cd /usr/local/go bin/go version 执行如上命令出现go的版本 ...
养成好的JAVA编码习惯
原文:http://blog.csdn.net/lifuxiangcaohui/article/details/25231027 最近的机器内存又爆满了,除了新增机器内存外,还应该好好review一下 ...
java中的堆内存和栈内存
Java把内存分成两种: 一种叫做栈内存一种叫做堆内存栈内存 : 在函数中定义的一些基本类型的变量和对象的引用变量都是在函数的栈内存中分配.当在一段代码块中定义一个变量时,java就在栈中为这个变 ...
Windows高精度时间
目录第1章计时 1 1.1 GetTickCount 1 1.2 timeGetTime 1 1.3 QueryPerformanceCounter 1 1.4 测试 ...
Linux下安装最新的Eclipse
欢迎关注我的社交账号: 博客园地址: http://www.cnblogs.com/jiangxinnju/p/4781259.html GitHub地址: https://github.com/ji ...
linux笔记：linux常用命令-网络命令
网络命令:ping(测试网络连通性) 网络命令:ifconfig(查看和设置网卡信息) 注意:在查看网卡信息时,直接输入ifconfig命令即可. 网络命令:last(列出目前和过去登入系统的用户信息 ...

Go语言并发与并行学习笔记(二)