Golang的CSP很酷?其实.NET也可以轻松完成
说起Golang(后面统称为Go),就想到他的高并发特性,在深入一些就是 Goroutine。在大家被它优雅的语法和简洁的代码实现的高并发程序所折服时,其实C#/.NET也可以很容易的做到。今天我们来参照Go,来用C#实现它所采用的的CSP并发模型。
CSP(Communicating sequential processes)
这东西我一开始以为很简单,后面差了资料发现它独树一帜,自己是一门语言,也是一套理论。这边我不深入的对它做过多的见解,我怕耽误大家=_=,大家可以看看wiki。
wiki:https://en.wikipedia.org/wiki/Communicating_sequential_processes
我们从Go的角度对它进行一些分析,摘抄一段概要:
“用于描述两个独立的并发实体通过共享的通讯 channel(管道)进行通信的并发模型。 CSP中channel是第一类对象,它不关注发送消息的实体,而关注与发送消息时使用的channel。”
好了,单独写出 CSP 是为了让大家了解这是一套独立于语言的东西,大家有兴趣可以查看wiki和搜索一些其它资料。
在Go中的CSP
Channel(通道)
Goroutine(不知道怎么翻译,大家可以理解成一个“工作者”,不是工作者线程。本质是实现了协程。)
协程(提升并发的利器)
大家都很明白线程能做什么,但协程是个什么东西?比起线程又如何呢?
线程
我们重新思考一些东西。
CPU:核心、超线程
OS:线程
编程语言:线程池
这边不做细讲,只是大概点到一下。
我们所做的任何计算都要经由CPU计算,而CPU的核数直接决定了我们能给CPU执行几件事情。
我们现在所常用的OS内部都有一个轮询,用时间片的形式来分配任何轮流使用CPU执行计算,线程就是这些任务的载体。
这块的概念非常庞大(还有牵扯到,什么是并发,什么事并行),本文的重点不是这些,大家有兴趣后面可以单独开一篇文章来解释这块的内容。
回归本文,现在我们知道线程是操作系统级别用来共享CPU的一种技术实现,多线程编程早在各大语言遍地开花,被用的惟妙惟肖,百花齐放。
那么为什么需要协程呢?
线程的开销
这块又是一个大知识点,这边也不多做介绍。
大家只要明白,线程并不是廉价的,一个线程的创立有至少两点的开销
- 内存
- 调度器压力(线程上下文切换等)
线程是可以持有逻辑数据的(比如,HttpContext.Current,等对象)所以必定是占用内存的(至于占用了多少内存不同的语言和OS不一样)
如果一个CPU是4核的,同时就只能处理4件任务,一个OS的线程越多他们轮训一整圈所耗的时间就更长。而每次调度线程时都需要复制当前线程上下文的状态,再去读取准备调度线程上下文的状态。
这边可以看到最后一点,有时候多线程反而会比单线程更加的慢,所以多线程提升性能本质上其实是假的。多线程并不会提升程序性能。
我知道这边肯定有人会心存疑问,绝大数的人都说用多线程来提升性能,为什么这边说多线程会比单线程慢?
我们这边想一下:PHP 和 NodeJS,PHP默认不支持多线程,NodeJS采用单线程事件轮询,他们的效率比拥有多线程的语言低吗?并不会。
多线程之所以快是因为作弊,别人一个人干的事情你叫两个人去干当然会比单线程快。这也有非常大的限制,多线程所执行的东西尽可能避免共享,不然你的效率还是可能不如单线程。
这边说的有点跑题,这块的内容实在太大,大家只要知道,线程即使不昂贵也绝不廉价。
针对这个问题,各大语言都推出了一个叫做线程池的技术,我申请一批线程,持有他,等到有任务的时候直接使用,这样我就不会频繁的创建和销毁线程了。这样大大提升了效率。
在.NET中,很早就提倡任何需要线程的时刻都使用 ThreadPool。
ps:现在觉大多数(我还没见过)的语言(runtime)中,线程与操作系统的线程是一一对应的。
回归协程
协程与线程是一对多的关系,有多个协程会对应到一根线程上。跟线程和CPU是一样的关系。
线程是为了共享CPU,而协程是为了共享线程。
协程是应用层面的自有“线程”实现。也就是说在不改变OS的线程逻辑下,自己构建了一套 “线程”系统。
为什么不直接改动OS的线程,让其更轻?我个人觉得 1是历史兼容性问题,2是必要性问题,线程是一个很好的抽象逻辑。实现协程完全可以通过线程来完成。
协程的目的
我们来思考一个场景
抓取百度、google、bing的html。
多线程的做法是
启动三个线程,分别对百度、google、bing发起HTTP GET请求。这时候使用了三个线程。
协程的做法是(极端)
启动一个线程对百度发起HTTP GET请求,将任务放入队列,在对google发起HTTP GET请求,将任务放入队列,在对bingHTTP GET请求将任务放入队列。
这时候只需要使用一个线程(极端情况下,其实大多数实现来说至少需要两个线程,因为需要有一个后台线程去监听任务队列,当任务完成后再分配一个可用线程去处理下面的逻辑)
为什么说极端情况下?因为协程有时候也可能会与线程一一对应,比如你的CPU有8个核心,同时跑4个协程也有可能会分配4根线程单独去处理这4个任务,这主要取决于调度算法。
总结:协程是为了提升线程利用率,减少线程的无用功(大多数是IO堵塞),协程也更适合IO密集型的场景。
C#中的协程
可以看到,3个任务是异步执行的,但都由线程4来处理,也就是说三个异步任务只用了一根线程。
C#中的CSP
讲了这么大篇幅的协程,终于回归了今天的主题。
其实单单实现CSP来说根本不用理清线程和协程。但今天主要对比的是Go中的CSP,所以如果没有协程基本是没有意义的。
C#如何对应,CSP中最重要的Channel呢?
答案就是:BlockingCollection<T>
我们来看一个例子
抓取一批网站并输出网站的title
发起 HTTP GET 请求 和分析Title的代码逻辑如下:
主程序的代码如下:
执行逻辑
- 启用一个生产者协程来根据url生产对应的html、同时使用主线程消费队列内的内容(异步)
- 每个url单独起一个协程来发起HTTP GET请求
- 生产者协程等待所有url的html全部加载完成
- 标志队列完成
- 主线程退出
执行结果如下:
Go协程与.NET协程的区别?
去除实现上的一些逻辑,本质上没太多区别。
但Go有一个天生优势就是它是新时代的语言,抛弃了线程。也就是说Go层面没有线程的东西,它只有协程。
但.NET中线程已经拥有了好多年,大量的类库、驱动使用线程来完成。
所以你在上一层就算使用了协程,执行到底部不一定只有一根线程来完成,底部可以自己创建线程来运行逻辑,今天篇幅关系不做过多说明。后面我们在介绍这块的内容。
写在最后
最后总结一个要点,多线程、协程并不能提升性能,它们所达到的目的只是提高CPU利用率。
今天本来想详细写BlockingCollection<T>的使用说明,但协程等概念占了大量的篇幅,后面我们再来详细介绍.NET中的异步编程。
.NET技术栈QQ群:384413261(点击加入 .NET Group)
Golang的CSP很酷?其实.NET也可以轻松完成的更多相关文章
- [golang note] 类型系统
值和引用 • 值语义和引用语义 值语义和引用语义的差别在于赋值: b = a b.Modify() 如果b的修改不会影响a的值,那么属于值类型,否则属于引用类型. • 值类型和引用类型 √ 引用类型一 ...
- go goroutine
进程和线程 进程是程序在操作系统中的一次执行过程,系统进行资源分配和调度的 一个独立单位. 线程是进程的一个执行实体,是CPU调度和分派的基本单位,它是比进程更 小的能独立运行的基本单位. 一个进程可 ...
- Python协程与Go协程的区别二
写在前面 世界是复杂的,每一种思想都是为了解决某些现实问题而简化成的模型,想解决就得先面对,面对就需要选择角度,角度决定了模型的质量, 喜欢此UP主汤质看本质的哲学科普,其中简洁又不失细节的介绍了人类 ...
- UI语言杂集
最适合做 GUI 的是 DSL 或者 XML(以及 XML 的扩展)之类的标记语言,而不是编程语言. 例如 Qt 的 QML,Android 的 XML 或者 WPF 的 XAML 以及大家都再熟悉不 ...
- NATS源代码之logger目录
nats的logger目录文件如下 log.go syslog.go syslog_windows.go 基于golang语言的logger包实现日志功能. Golang的log包短小精悍,可以非常轻 ...
- Golang游戏服务器
我对和GOLANG写MMO服务器的一些遐想: 1.沙盒(隔离性) SKYNET:原生LUA STATE作为沙盒, 进行服务器间隔离安全性高: 服务可以很容易的配置到不同节点之上. GO:估计用RECO ...
- golang channel 用法转的
一.Golang并发基础理论 Golang在并发设计方面参考了C.A.R Hoare的CSP,即Communicating Sequential Processes并发模型理论.但就像John Gra ...
- Golang全接触
满打满算, 从好友推荐Golang至发文时, 使用Golang已经有1年多了. 这种时间对于C/C++ Java这些老者来说, 简直是菜鸟级别的经验 但作为新生代语言的特点就是实战. Golang这一 ...
- GO开发[一]:golang开发初探
一.Golang的安装 1.https://dl.gocn.io/ (国内下载地址) 2.https://golang.org/dl/ (国外下载地址) 3.现在studygolang中文网也可以了h ...
随机推荐
- Hibernate 一对一中的一些问题
1.对于想查询一对一种一方为空的时候使用 例如一个用户对应一个人,则要从人查找没有用户的人员的话, 使用hql语句是查询不到的 我今天也碰到了这个问题,研究了下,可以用以下语句查出来:from Per ...
- .NET中的按需加载/延迟加载 Lazy<T>
业务场景: 在项目开发中,经常会遇到特定的对象使用的加载问题,有的实例对象我们创建之后并非需要使用,只是根据业务场景来调用,所以可能会导致很多无效的实例加载 延迟初始化出现于.NET 4.0,主要用于 ...
- CodeForces-731B
如果当天有m支队伍,昨天选择了k个B方案,那么今天还需要买m-k个披萨,如果m-k是奇数,那就先买一种B,剩下的全部买A,如果是偶数,全部买A.如果中途出现只有0支队伍,然而昨天却买了一次B,那么直接 ...
- SMJobBless官方Demo笔记
SMJobBless是苹果官方提供的用于"MacOS app获取root权限"的demo. 具体思路 使用Security.framework和ServiceManagement. ...
- __proto__ 与 prototype
先来做个复习,ES5中有有几种数据类型呢? 5种基本数据类型 Undefined Null Boolean Number String 1种复杂数据类型 Object 除了基本数据类型,万物皆对象,记 ...
- Davinci DM6446开发攻略——u-boot-1.3.4移植(1)
UBOOT的版本更新速度比较快,截止今天,稳定正式的版本是u-boot-2009.11-rc2,而TI最新的EVM开发包里的UBOOT是1.2.0版本,国内很多公司还一直使用u-boot-1.1.4和 ...
- mysql 查询表死锁 和结束死锁的表步骤
1.查询是否锁表 show OPEN TABLES ; 2.查询进程 show processlist 查询到相对应的进程===然后 kill id 3.查看正在锁的事务 SELECT * FR ...
- PHP_保留两位小数并且四舍五入_保留两位小数并且不四舍五入
php保留两位小数并且四舍五入 $num = 123213.666666; echo sprintf("%.2f", $num); php保留两位小数并且不四舍五入 php进一法取 ...
- FusionCharts ID重复
1.今天在做项目时,有关FusionCharts柱状图的,调试的过程中,我发现IE浏览器出现FusionCharts ID重复. 具体的消息如下: 消息:#25081843:IECompatibili ...
- 芝麻HTTP:PhantomJS的安装
PhantomJS是一个无界面的.可脚本编程的WebKit浏览器引擎,它原生支持多种Web标准:DOM操作.CSS选择器.JSON.Canvas以及SVG. Selenium支持PhantomJS,这 ...