Go素数筛选分析
Go素数筛选分析
1. 素数筛选介绍
学习Go
语言的过程中,遇到素数筛选的问题。这是一个经典的并发编程问题,是某大佬的代码,短短几行代码就实现了素数筛选。但是自己看完原理和代码后一脸懵逼(仅此几行能实现素数筛选),然后在网上查询相关资料,依旧似懂非懂。经过1天的分析调试,目前基本上掌握了的原理。在这里介绍一下学习理解的过程。
素数筛选基本原理如下图:
就原理来说还是比较简单的,首先生成从 2
开始的递增自然数,然后依次对生成的第 1, 2, 3, ...个素数
整除,经过全部整除仍有余数的自然数,将会是素数。
大佬的代码如下:
// 返回生成自然数序列的管道: 2, 3, 4, ...
// GenerateNatural 函数内部启动一个 Goroutine 生产序列,返回对应的管道
func GenerateNatural() chan int {
ch := make(chan int)
go func() {
for i := 2; ; i++ {
ch <- i
}
}()
return ch
}
// 管道过滤器: 将输入序列中是素数倍数的数淘汰,并返回新的管道
// 函数内部启动一个 Goroutine 生产序列,返回过滤后序列对应的管道
func PrimeFilter(in <-chan int, prime int) chan int {
out := make(chan int)
go func() {
for {
if i := <-in; i%prime != 0 {
out <- i
}
}
}()
return out
}
func main() {
ch := GenerateNatural() // 自然数序列: 2, 3, 4, ...
for i := 0; i < 100; i++ {
prime := <-ch // 新出现的素数
fmt.Printf("%v: %v\n", i+1, prime)
ch = PrimeFilter(ch, prime) // 基于新素数构造的过滤器
}
}
main()
函数先是调用 GenerateNatural()
生成最原始的从 2
开始的自然数序列。然后开始一个 100
次迭代的循环,希望生成 100
个素数。在每次循环迭代开始的时候,管道中的第一个数必定是素数,我们先读取并打印这个素数。然后基于管道中剩余的数列,并以当前取出的素数为筛子过滤后面的素数。不同的素数筛子对应的管道是串联在一起的。
运行代码,程序正确输出如下:
1: 2
2: 3
3: 5
......
......
98: 521
99: 523
100: 541
2. 代码分析
之前在课本中学习到:chan底层结构 是一个指针,所以我们能在函数间直接传递 channel,而不用传递 channel 的指针
。
上述代码fun GenerateNatural()
中创建了管道ch := make(chan int)
,并创建一个协程(为了便于描述,该协程称为Gen
)持续向ch
中写入渐增自然数。
当i=0
时,main()
中prime := <-ch
读取该ch
(此时prime=2
,输出素数2
),接着将ch
传入PrimeFilter(ch, prime)
中。PrimeFilter(ch, prime)
创建新协程(称为PF(ch, 2)
)持续读取传入的ch
(ch
中2
之前已被取出,从3
依次往后读取),同时返回一个新的chan out
(当通过过滤器的i
向out
写入时,此时out
仅有写入而没有读取操作,PF(ch, 2)
将阻塞在第1
次写chan out
操作)。与此同时main()
中ch = PrimeFilter(ch, 2)
将out
赋值给ch
,此操作给ch
赋了新变量。到这里,重点来了:由于在随后的时间里,协程Gen
、PF(ch, 2)
中仍需要不停写入和读取ch
,这里将out
赋值给ch
的操作是否会更改Gen
、PF(ch, 2)
两协程中ch
的值了?
直接给出答案(后面会给出代码测试),此时ch
赋新值不影响Gen
、PF(ch, 2)
两协程,仅影响main() for
循环体随后对chan
的操作。(本人认为go
中channel
参数传递采用了channel
指针的拷贝,后续给channel
赋新值相当于将该channel
重新指向了另外一个地址,该channel
与之前协程中使用的channel
分别指向不同地址,是完全不同的变量)。为了便于后面分析,这里将ch = PrimeFilter(ch, 2)
赋值后的ch
称为ch_2
。
当i=1
时,main() for
循环读取前一次产生新的ch_2
赋值给prime
(此时prime=3
,输出素数3
),接着将ch_2
传入PrimeFilter(ch, prime)
并创建新协程(称为PF(ch, 3)
),而后ch = PrimeFilter(ch, 3)
将新产生的out
赋值给ch
,称为ch_3
。与此同时协程Gen
持续向ch
中写入直至阻塞,携程PF(ch, 2)
持续读取ch
值并写入ch_2
直至阻塞,新协程PF(ch, 3)
持续读取ch_2
值并输出至chan out(即ch_3)
(此时ch_3
仅有写入而没有读取操作,PF(ch, 3)
将阻塞在第1
次写ch_3
操作)。
当i
继续增加时,后面的结果以此类推。
总结一下:main()
函数中,每循环1
次,会增加一个协程PF(ch, prime)
,且协程Gen
与新增加的协程之间是串联的关系(即前一个协程的输出,作为下一个协程的输入,二者通过channel
交互),协程main
每次循环读取最后一个channel
的第1
个值,获取prime
素数。基本原理如下图所示。
3. 代码验证
(1) channel参数传递验证
func main() {
ch1 := make(chan int)
go write(ch1)
go read(ch1)
time.Sleep(time.Second * 3)
fmt.Println("main() 1", ch1)
ch2 = make(chan int)
ch1 = ch2
fmt.Println("main() 2", ch1)
time.Sleep(time.Second * 3)
}
func read(ch1 chan int) {
for {
time.Sleep(time.Second)
fmt.Println("read", <-ch1, ch1)
}
}
func write(ch1 chan int) {
for {
time.Sleep(time.Second)
fmt.Println("write", ch1)
ch1 <- 5
}
}
测试代码比较简单,在main()
中创建chan ch1
,后创建两个协程write
、read
分别对ch1
不间断写入与读取,持续一段时间后,main()
新创建ch2
,并赋值给ch1
,查看协程write
、read
是否受到影响。
...
write 0xc000048120
read 5 0xc000048120
main() 1 0xc000048120
main() 2 0xc000112000
write 0xc000048120
read 5 0xc000048120
...
程序输出如上,可以看到ch1
地址为0xc000048120
,ch2
地址为0xc000112000
。main()
中ch1
的重新赋值不会影响到其他协程对ch1
的读写。
(2) 素数筛选代码验证
在之前素数筛选源码的基础上,添加一些调试打印代码,以便更容易分析代码,如下所示。
package main
import (
"fmt"
"runtime"
"sync/atomic"
)
var total uint32
// 返回生成自然数序列的管道: 2, 3, 4, ...
func GenerateNatural() chan int {
ch := make(chan int)
go func() {
goRoutineId := atomic.AddUint32(&total, 1)
for i := 2; ; i++ {
//fmt.Println("before generate", i)
ch <- i
fmt.Printf("[routineId: %.4v]----generate i=%v, ch=%v\n", goRoutineId, i, ch)
}
}()
return ch
}
// 管道过滤器: 删除能被素数整除的数
func PrimeFilter(in <-chan int, prime int) chan int {
out := make(chan int)
go func() {
goRoutineId := atomic.AddUint32(&total, 1)
for {
i := <-in
if i%prime != 0 {
fmt.Printf("[routineId: %.4v]----read i=%v, in=%v, out=%v\n", goRoutineId, i, in, out)
out <- i
}
}
}()
return out
}
func main() {
goRoutineId := atomic.AddUint32(&total, 1)
ch := GenerateNatural() // 自然数序列: 2, 3, 4, ...
for i := 0; i < 100; i++ {
//fmt.Println("--------before read prime")
prime := <-ch // 新出现的素数
fmt.Printf("[routineId: %.4v]----main i=%v; prime=%v, ch=%v, total=%v\n", goRoutineId, i+1, prime, ch, runtime.NumGoroutine())
ch = PrimeFilter(ch, prime) // 基于新素数构造的过滤器
}
}
1)打印协程id
由于Go
语言没有直接把获取go
程id
的接口暴露出来,这里采用atomic.AddUint32
原子操作,每次新建1
个协程时,将atomic.AddUint32(&total, 1)
的值保存下来,作为该协程的唯一id
。
2)输出结果分析
[routineId: 0002]----generate i=2, ch=0xc000018180
[routineId: 0001]----main i=1; prime=2, ch=0xc000018180, total=2
[routineId: 0003]----read i=3, in=0xc000018180, out=0xc000090000
[routineId: 0002]----generate i=3, ch=0xc000018180
[routineId: 0001]----main i=2; prime=3, ch=0xc000090000, total=3
[routineId: 0002]----generate i=4, ch=0xc000018180
[routineId: 0002]----generate i=5, ch=0xc000018180
[routineId: 0003]----read i=5, in=0xc000018180, out=0xc000090000
[routineId: 0002]----generate i=6, ch=0xc000018180
[routineId: 0002]----generate i=7, ch=0xc000018180
......
输出结果如上,main
协程id=1
,GenerateNatural
协程id=2
,PrimeFilter(ch, prime)
协程id
从3
开始递增。这里还是不太容易看明白,下面分类阐述输出结果。
首先,单独查看GenerateNatural
协程输出,如下。可以看出,此协程就是在写入阻塞交替间往ch=0xc000018180
中写入数据。
[routineId: 0002]----generate i=2, ch=0xc000018180
[routineId: 0002]----generate i=3, ch=0xc000018180
[routineId: 0002]----generate i=4, ch=0xc000018180
[routineId: 0002]----generate i=5, ch=0xc000018180
[routineId: 0002]----generate i=6, ch=0xc000018180
[routineId: 0002]----generate i=7, ch=0xc000018180
[routineId: 0002]----generate i=8, ch=0xc000018180
[routineId: 0002]----generate i=9, ch=0xc000018180
......
接着,查看PrimeFilter(ch, prime)
协程,如下。每输出1
个素数,将增加1
个PrimeFilter(ch, prime)
协程,且协程id
号从3
开始递增。
[routineId: 0003]----read i=3, in=0xc000018180, out=0xc000090000
......
[routineId: 0004]----read i=5, in=0xc000090000, out=0xc0000181e0
......
[routineId: 0005]----read i=7, in=0xc0000181e0, out=0xc00020a000
......
[routineId: 0006]----read i=11, in=0xc00020a000, out=0xc00020a060
......
可以看出,协程[routineId: 0003]
读取GenerateNatural
协程ch=0xc000018180
值作为输入,并将out=0xc000090000
输出作为[routineId: 0004]
协程输入。以此类推,从id>=2
开始的多个协程是通过channel
管道串联在一起的,且前一个协程的输出作为后一个协程的输入。与前述分析一致。
最后,查看main
线程,其id=1
,可见main
每次循环读取最后一个channel
的第1
个值,且该值为素数。与前述分析一致。
[routineId: 0002]----generate i=2, ch=0xc000018180
[routineId: 0001]----main i=1; prime=2, ch=0xc000018180, total=2
[routineId: 0003]----read i=3, in=0xc000018180, out=0xc000090000
......
[routineId: 0001]----main i=2; prime=3, ch=0xc000090000, total=3
......
[routineId: 0004]----read i=5, in=0xc000090000, out=0xc0000181e0
......
[routineId: 0001]----main i=3; prime=5, ch=0xc0000181e0, total=4
[routineId: 0005]----read i=7, in=0xc0000181e0, out=0xc00020a000
[routineId: 0001]----main i=4; prime=7, ch=0xc00020a000, total=5
4. 总结
- 对
Go
不同协程中chan
的传递原理了解不深,且素数筛选代码中多个协程统一使用了ch
名称,特别是对于main()中ch的重新赋值会不会影响其他协程
不甚了解,导致理解混乱。 - 经深入分析代码后理解了素数筛选的内部原理,可谓知其所以然,然如果让自己来设计,代码肯定会臃肿非常多,对于大佬能用如此简单的代码实现功能,万分钦佩!
Go素数筛选分析的更多相关文章
- 51nod 1536不一样的猜数游戏 思路:O(n)素数筛选法。同Codeforces 576A Vasya and Petya's Game。
废话不多说,先上题目. 51nod Codeforces 两个其实是一个意思,看51nod题目就讲的很清楚了,题意不再赘述. 直接讲我的分析过程:刚开始拿到手有点蒙蔽,看起来很难,然后......然后 ...
- HDU4548美素数——筛选法与空间换时间
对于数论的学习比较的碎片化,所以开了一篇随笔来记录一下学习中遇到的一些坑,主要通过题目来讲解 本题围绕:素数筛选法与空间换时间 HDU4548美素数 题目描述 小明对数的研究比较热爱,一谈到数,脑子里 ...
- 1341 - Aladdin and the Flying Carpet ---light oj (唯一分解定理+素数筛选)
http://lightoj.com/volume_showproblem.php?problem=1341 题目大意: 给你矩形的面积(矩形的边长都是正整数),让你求最小的边大于等于b的矩形的个数. ...
- codeforces Soldier and Number Game(dp+素数筛选)
D. Soldier and Number Game time limit per test3 seconds memory limit per test256 megabytes inputstan ...
- POJ 3978 Primes(素数筛选法)
题目 简单的计算A,B之间有多少个素数 只是测试数据有是负的 //AC //A和B之间有多少个素数 //数据可能有负的!!! #include<string.h> #include< ...
- POJ 2689 Prime Distance (素数筛选法,大区间筛选)
题意:给出一个区间[L,U],找出区间里相邻的距离最近的两个素数和距离最远的两个素数. 用素数筛选法.所有小于U的数,如果是合数,必定是某个因子(2到sqrt(U)间的素数)的倍数.由于sqrt(U) ...
- algorithm@ Sieve of Eratosthenes (素数筛选算法) & Related Problem (Return two prime numbers )
Sieve of Eratosthenes (素数筛选算法) Given a number n, print all primes smaller than or equal to n. It is ...
- LightOJ 1236 Pairs Forming LCM (LCM 唯一分解定理 + 素数筛选)
http://lightoj.com/volume_showproblem.php?problem=1236 Pairs Forming LCM Time Limit:2000MS Memor ...
- LightOJ 1259 Goldbach`s Conjecture (哥德巴赫猜想 + 素数筛选法)
http://lightoj.com/volume_showproblem.php?problem=1259 题目大意:给你一个数n,这个数能分成两个素数a.b,n = a + b且a<=b,问 ...
随机推荐
- 9. 利用Docker快速构建MGR | 深入浅出MGR
目录 1.安装Docker 2.拉取GreatSQL镜像,并创建容器 2.1 拉取镜像 2.2 创建新容器 2.3 容器管理 3.构建MGR集群 3.1 创建专用子网 3.2 创建3个新容器 3.3 ...
- Linux 08 磁盘管理
参考源 https://www.bilibili.com/video/BV187411y7hF?spm_id_from=333.999.0.0 版本 本文章基于 CentOS 7.6 概述 Linux ...
- iommu分析之---DMA remap框架实现
本文主要介绍iommu的框架.基于4.19.204内核 IOMMU核心框架是管理IOMMU设备的一个通过框架,IOMMU设备通过实现特定的回调函数并将自身注册到IOMMU核心框架中,以此通过IOMMU ...
- k8s驱逐篇(3)-kubelet节点压力驱逐-源码分析篇
kubelet节点压力驱逐-概述 kubelet监控集群节点的 CPU.内存.磁盘空间和文件系统的inode 等资源,根据kubelet启动参数中的驱逐策略配置,当这些资源中的一个或者多个达到特定的消 ...
- MySQL数据库如何线上修改表结构
一.MDL元数据锁 在修改表结构之前,先来看下可能存在的问题. 1.什么是MDL锁 MySQL有一个把锁,叫做MDL元数据锁,当对表修改的时候,会自动给表加上这把锁,也就是不需要自己显式使用. 当对表 ...
- 专注效率提升「GitHub 热点速览 v.22.36」
本周最大的 GitHub 事件无疑是国内多家自媒体报道过的,GitHub 官方或将下架 GitHub Trending 页面.作为 GitHub Trending 长期用户,本周也是找到了实用且提升效 ...
- sys.path的使用场景
起因 在初学python时,经常遇到找不到某个路径下的文件,或者在博客中找到的代码需要暴露出环境变量(如linux中可以export PYTHONPATH="$PYTHON;/carla/b ...
- PostgreSQL 与 Oracle 访问分区表执行计划差异
熟悉Oracle 的DBA都知道,Oracle 访问分区表时,对于没有提供分区条件的,也就是在无法使用分区剪枝情况下,优化器会根据全局的统计信息制定执行计划,该执行计划针对所有分区适用.在分析利弊之前 ...
- Mac隔空投送功能
使用mac 或iphone 的隔空投送功能可以互发文件,亲测可用 具体可以看mac的文档 需要注意的是: 如果是mac传iphone,iphone会显示你需要存储文件的地方,比如选择在文稿中.然后在文 ...
- 2020年12月-第01阶段-前端基础-HTML CSS 项目阶段(三)
品优购项目(三) 1. 首页制作 1). 楼层区 floor 注意这个floor 一个大盒子 包含, 不要给高度,内容有多少,算多少 2). 家用电器模块 这个模块 简单 不需要写样式 版心居中对齐 ...