Boost - 从Coroutine2 到Fiber

协程引子

我开始一直搞不懂协程是什么,网上搜一搜,(尤其是Golang的goroutine)感觉从概念上听起来有点像线程池,尤其是类似Java的ExcutorService类似的东西

package helloworld;

import java.util.Calendar;
import java.util.Date;
import java.util.concurrent.Callable;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.Future; public class CallMe {
static class Call implements Callable<String>{ @Override
public String call() throws Exception {
Date d = Calendar.getInstance().getTime();
return d.toString();
} } public static void main(String[] args) throws Exception{
ExecutorService pool = Executors.newSingleThreadExecutor();
Future<String> str = pool.submit(new Call());
pool.shutdown();
String ret = str.get();
System.out.println(ret);
}
}
package main

import (
"fmt"
"time"
) func CallMe(pipe chan string) {
t := time.Now()
pipe <- t.String()
} func main() {
pipe := make(chan string, 1)
defer close(pipe)
go CallMe(pipe)
select {
case v, ok := <-pipe:
if !ok {
fmt.Println("Read Error")
}
fmt.Println(v)
}
}

是的,协程除了它要解决的问题上,其他可以说就是线程。

那么协程要解决什么问题呢?

这要从协程为什么火起来说起。线程池很好,但线程是由操作系统调度的,并且线程切换代价太大,往往需要耗费数千个CPU周期。

在同步阻塞的编程模式下,

当并发量很大、IO密集时,往往一个任务刚进入线程池就阻塞在IO,就可能(因为线程切换是不可控的)需要切换线程,这时线程切换的代价就不可以忽视了。

后来人们发现异步非阻塞的模型能解决这个问题,当被IO阻塞时,直接调用非阻塞接口,注册一个回调函数,当前线程继续进行,也就不用切换线程了。但理想很丰满,现实很骨感,异步的回调各种嵌套让程序员的人生更加悲惨。

于是协程应运重生。

协程就是由程序员控制跑在线程里的“微线程”。它可以由程序员调度,切换协程时代价小(切换根据实现不同,消耗的CPU周期从几十到几百不等),创建时耗费资源小。十分适用IO密集的场景。

Boost::Coroutine2

boost的Coroutine2不同于Goroutine,golang的协程调度是由Go语言完成,而boost::coroutine2的协程需要自己去调度。

#include <boost\coroutine2\all.hpp>

#include <cstdlib>
#include <iostream> using namespace boost;
using namespace std; class X {
public:
X() {
cout << "X()\n";
}
~X() {
cout << "~X()\n";
system("pause");
}
}; void foo(boost::coroutines2::coroutine<void>::pull_type& pull) {
X x;
cout << "a\n";
pull();
cout << "b\n";
pull();
cout << "c\n";
} int main() {
coroutines2::coroutine<void>::push_type push(foo);
cout << "1\n";
push();
cout << "2\n";
push();
cout << "3\n";
push(); return 0;
}

调用push_type和pull_type的operator()就会让出当前执行流程给对应的协程。push_type可以给pull_type传递参数,而pull_type通过调用get来获取。

你也可以写成这样

boost::coroutines2::coroutine<void>::pull_type pull([](coroutine<void>::push_type &push){...})

它和上面的区别是,新建的pull_type会立即进入绑定的函数中(哪里可以调用push(),哪个协程先执行)

那如果在main结束之前,foo里没有执行完,那foo里的X会析构吗?

Boost文档里说会的,这个叫做Stack unwinding

我们不妨把main函数里最后一个push();去掉,这样后面就不会切换到foo的context了。会发现虽然foo中的"c"没有输出,但X还是析构了的。

Fiber

在实际生产中,我们更适合用fiber来解决问题。fiber有调度器,使用简单,不需要手动控制执行流程。

#include <boost\fiber\all.hpp>

#include <chrono>
#include <string>
#include <ctime>
#include <iostream>
#include <cstdlib> using namespace std;
using namespace boost; void callMe(fibers::buffered_channel<string>& pipe) {
std::time_t result = std::time(nullptr);
string timestr = std::asctime(std::localtime(&result));
pipe.push(timestr);
} int main() {
fibers::buffered_channel<string> pipe(2);
fibers::fiber f([&]() {callMe(pipe); });
f.detach();
string str;
pipe.pop(str);
cout << str << "\n";
system("pause"); return 0;
}

boost::fibers是一个拥有调度器的协程。看上去fiber已经和goroutine完全一样了。在fiber里不能调用任何阻塞线程的接口,因为一旦当前fiber被阻塞,那意味着当前线程的所有fiber都被阻塞了。因此所有跟协程相关的阻塞接口都需要自己实现一套协程的包装,比如this_fiber::sleep_for()。这也意味着数据库之类的操作没办法被fiber中直接使用。但好在fiber提供了一系列方法去解决这个问题。

使用非阻塞IO

int read_chunk( NonblockingAPI & api, std::string & data, std::size_t desired) {
int error;
while ( EWOULDBLOCK == ( error = api.read( data, desired) ) ) {
boost::this_fiber::yield();
}
return error;
}

主要思想就是,当前fiber调用非阻塞api轮询,一旦发现该接口会阻塞,就调用boost::this_fiber::yield()让出执行权限给其他协程,知道下次获得执行权限,再次查看是否阻塞。

异步IO

std::pair< AsyncAPI::errorcode, std::string > read_ec( AsyncAPI & api) {
typedef std::pair< AsyncAPI::errorcode, std::string > result_pair;
boost::fibers::promise< result_pair > promise;
boost::fibers::future< result_pair > future( promise.get_future() );
// We promise that both 'promise' and 'future' will survive until our lambda has been called.
// Need C++14
api.init_read([promise=std::move( promise)]( AsyncAPI::errorcode ec, std::string const& data) mutable {
promise.set_value( result_pair( ec, data) );
});
return future.get();
}

这种实现方法主要是利用了异步IO不会阻塞当前fiber,在异步的回调中给fibers::promise设值。当异步操作未返回时,如果依赖到异步的结果,在调用future.get()时就会让出执行权限给其他协程。

同步IO

同步IO不可以直接应用到fiber中,因为会阻塞当前线程而导致线程所有的fiber都阻塞。

如果一个接口只有同步模式,比如官方的Mysql Connector,那我们只能先利用多线程模拟一个异步接口,然后再把它当做异步IO去处理。

如何用多线程把同步接口包装成异步接口呢?

如下,包装好后就可以利用上面异步IO的方法再包装一个fiber可以使用的IO接口。

#include <boost/asio.hpp>
#include <boost/fiber/all.hpp> #include <string>
#include <thread>
#include <cstdlib> #include <stdio.h> using namespace std;
using namespace boost; class AsyncWrapper
{
public:
void async_read(const string fileName, function<void (const string &)> callback) {
auto fun = [=]() {
FILE* fp = fopen(fileName.c_str(), "r");
char buff[1024];
string tmp;
while (nullptr != fgets(buff, 1024, fp)) {
tmp += buff;
}
fclose(fp); callback(tmp);
};
asio::post(pool, fun);
} static void wait() {
pool.join();
} protected:
static asio::thread_pool pool;
}; asio::thread_pool AsyncWrapper::pool(2); int main()
{
AsyncWrapper wrap;
string file = "./temp.txt";
wrap.async_read(file, [](const string& result) {printf("%s\n", result.c_str()); }); AsyncWrapper::wait(); std::system("pause");
return 0;
}

golang方便在哪

golang的好处就在于它已经帮你完成了上述的封装过程,它把所有的IO操作都封装成了阻塞同步调用模式,无非也是通过上面两种方法。这样程序员调用的时候 感觉自己在写同步的代码,但却能享受异步/非阻塞带来的好处。

例如

package main

import (
"log"
"os"
"sync"
"time"
) var wg sync.WaitGroup func blockSleep() {
log.Printf("blockSleep Before bock----------")
time.Sleep(1 * time.Second)
log.Printf("blockSleep After bock----------")
wg.Done()
} func writeFile() {
log.Printf("writeFile Before bock+++++++++++")
f, _ := os.Create("./temp.txt")
defer f.Close()
log.Printf("writeFile Before Write+++++++++++")
f.WriteString("Hello World")
log.Printf("writeFile After bock+++++++++++")
wg.Done()
} func main() {
go writeFile()
wg.Add(1)
for i := 1; i < 5; i++ {
go blockSleep()
wg.Add(1)
}
wg.Wait()
}

这段代码time.Sleepos.Create都会造成当前协程让出CPU。其输出如下

2018/05/31 13:53:19 blockSleep Before bock----------
2018/05/31 13:53:19 blockSleep Before bock----------
2018/05/31 13:53:19 writeFile Before bock+++++++++++
2018/05/31 13:53:19 blockSleep Before bock----------
2018/05/31 13:53:19 writeFile Before Write+++++++++++
2018/05/31 13:53:19 writeFile After bock+++++++++++
2018/05/31 13:53:19 blockSleep Before bock----------
2018/05/31 13:53:20 blockSleep After bock----------
2018/05/31 13:53:20 blockSleep After bock----------
2018/05/31 13:53:20 blockSleep After bock----------
2018/05/31 13:53:20 blockSleep After bock----------

Boost - 从Coroutine2 到Fiber的更多相关文章

  1. Boost Coroutine2 - stackful coroutine简介

    协程可以很轻量的在子例程中进行切换,它由程序员进行子例程的调度(即切换)而不像线程那样需要内核参与,同时也省去了内核线程切换的开销,因为一个协程切换保留的就是函数调用栈和当前指令的寄存器,而线程切换需 ...

  2. Boost.Coroutine2:学习使用Coroutine(协程)

    function(函数)routine(例程)coroutine (协程) 函数,例程以及协程都是指一系列的操作的集合. 函数(有返回值)以及例程(没有返回值)也被称作subroutine(子例程), ...

  3. Visual studio 2017编译 boost

    下载: https://www.boost.org/   或者 https://dl.bintray.com/boostorg/release/1.66.0/source/ 下载完成以后解压到自己想要 ...

  4. boost的并发库

    thread: http://www.boost.org/doc/libs/1_61_0/libs/thread/ asio: http://www.boost.org/doc/libs/1_61_0 ...

  5. Boost 1.61.0 Library Documentation

    http://www.boost.org/doc/libs/1_61_0/ Boost 1.61.0 Library Documentation Accumulators Framework for ...

  6. CLion之C++框架篇-优化框架,引入boost(三)

      背景   结合上一篇CLion之C++框架篇-优化框架,单元测试(二),继续进行框架优化!这一版优化引入一个我们日常经常使用的操作库Boost,估算使用频率在70%以上!   Boost的优势在哪 ...

  7. Array的简单使用(Boost和STL通用)

    目录 目录 介绍 使用 Boost和STL的区别 介绍 本来这一次是想简单介绍一下Boost里面的协程库的使用的,但是Boost.Coroutine已经被废弃了,而Boost.Coroutine2目前 ...

  8. boost强分类器的实现

    boost.cpp文件下: bool CvCascadeBoost::train( const CvFeatureEvaluator* _featureEvaluator, int _numSampl ...

  9. Coroutine in Java - Quasar Fiber实现--转载

    转自 https://segmentfault.com/a/1190000006079389?from=groupmessage&isappinstalled=0 简介 说到协程(Corout ...

随机推荐

  1. javascript之网页跑马灯

    ---恢复内容开始--- <!DOCTYPE html> <html lang="en"> <head> <meta charset=&q ...

  2. 渗透测试学习 九、 MSsql注入上

    MSsql注入漏洞详解 (Asp.Aspx站,常见于棋牌网站.考试网站.大学网站.政府网站.游戏网站.OA办公系统) 大纲:msSQL数据库调用分析 msSQL注入原理 msSQL注入另类玩法 msS ...

  3. ajax的小知识---总是得到重复的数据

    按xmlhttp.open("GET","/try/ajax/demo_get.php",true);发送,可能会得到缓存中的结果; 可以改为xmlhttp.o ...

  4. XSS学习(一)

    XSS(一) XSS分类 1.反射型XSS 2.持久性XSS 3.DOM型XSS **** 反射型XSS 也称作非持久型,参数型跨站脚本 主要将Payload附加到URL地址参数中 例如: http: ...

  5. Spark配置参数详解

    以下是整理的Spark中的一些配置参数,官方文档请参考Spark Configuration. Spark提供三个位置用来配置系统: Spark属性:控制大部分的应用程序参数,可以用SparkConf ...

  6. mysql 8.0 主从复制的优化

    mysql 8.0复制改进一简介: 基于GTID下的并行复制,本文不考虑MGR架构二 主要特性   1 基于writeset的下的改进型并行复制     我在之前的一篇文章关于并行复制中详细的介绍了关 ...

  7. 浅析MSIL中间语言——基础篇(转)

    来自:https://www.cnblogs.com/dwlsxj/p/MSIL.html 一.开篇 研究MSIL纯属于个人喜好,说在前面MSIL应用于开发的地方很少,但是很大程度上能够帮着我们理解底 ...

  8. ubuntu设置 SSH 通过密钥对登录

    1. 制作密钥对 首先在服务器上制作密钥对.登录到打算使用密钥登录的账户,然后执行以下命令: [root@host ~]$ ssh-keygen <== 建立密钥对 Generating pub ...

  9. 工控随笔_13_西门子_WinCC的VBS脚本_04_变量类型之二

    上一个随笔说了一些关于vbs变量类型的内容,这一篇我们继续说说变量类型相关的内容. 一.NULL补充内容 '需要注意的是,NULL不能简单通过 = 来进行比较,而必须通过 'IsNull函数来实现 ' ...

  10. springMvc接收ajax数组参数,以及jquery复选框选中、反选、全选、全不选

    一.复选框选中.反选.全选.全不选 html代码: <input type='checkbox' name='menuCheckBox' value='10' >苹果 <input ...