PHP 使用协同程序实现合作多任务

多任务协作

如果阅读了上面的logger()例子，那么你认为“为了双向通信我为什么要使用协程呢？为什么我不能只用常见的类呢？”，你这么问完全正确。上面的例子演示了基本用法，然而上下文中没有真正的展示出使用协程的优点。这就是列举许多协程例子的理由。正如上面介绍里提到的，协程是非常强大的概念，不过这样的应用很稀少而且常常十分复杂。给出一些简单而真实的例子很难。

在这篇文章里，我决定去做的是使用协程实现多任务协作。我们尽力解决的问题是你想并发地运行多任务(或者“程序”）。不过处理器在一个时刻只能运行一个任务（这篇文章的目标是不考虑多核的）。因此处理器需要在不同的任务之间进行切换，而且总是让每个任务运行 “一小会儿”。

几点人

翻译于 5年前

3人顶

顶翻译得不错哦！

多任务协作这个术语中的“协作”说明了如何进行这种切换的：它要求当前正在运行的任务自动把控制传回给调度器，这样它就可以运行其他任务了。这与“抢占”多任务相反，抢占多任务是这样的：调度器可以中断运行了一段时间的任务，不管它喜欢还是不喜欢。协作多任务在Windows的早期版本（windows95)和Mac OS中有使用，不过它们后来都切换到使用抢先多任务了。理由相当明确：如果你依靠程序自动传回控制的话，那么坏行为的软件将很容易为自身占用整个CPU，不与其他任务共享。

这个时候你应当明白协程和任务调度之间的联系：yield指令提供了任务中断自身的一种方法，然后把控制传递给调度器。因此协程可以运行多个其他任务。更进一步来说，yield可以用来在任务和调度器之间进行通信。

几点人

翻译于 5年前

4人顶

顶翻译得不错哦！

我们的目的是对 “任务”用更轻量级的包装的协程函数:

<?php

class Task {

    protected $taskId;

    protected $coroutine;

    protected $sendValue = null;

    protected $beforeFirstYield = true;

    public function __construct($taskId, Generator $coroutine) {

        $this->taskId = $taskId;

        $this->coroutine = $coroutine;

    }

    public function getTaskId() {

        return $this->taskId;

    }

    public function setSendValue($sendValue) {

        $this->sendValue = $sendValue;

    }

    public function run() {

        if ($this->beforeFirstYield) {

            $this->beforeFirstYield = false;

            return $this->coroutine->current();

        } else {

            $retval = $this->coroutine->send($this->sendValue);

            $this->sendValue = null;

            return $retval;

        }

    }

    public function isFinished() {

        return !$this->coroutine->valid();

    }

}

一个任务是用任务ID标记一个协程。使用setSendValue()方法，你可以指定哪些值将被发送到下次的恢复（在之后你会了解到我们需要这个）。 run()函数确实没有做什么，除了调用send()方法的协同程序。要理解为什么添加beforeFirstYieldflag，需要考虑下面的代码片段：

<?php

function gen() {

    yield 'foo';

    yield 'bar';

}

$gen = gen();

var_dump($gen->send('something'));

// As the send() happens before the first yield there is an implicit rewind() call,

// so what really happens is this:

$gen->rewind();

var_dump($gen->send('something'));

// The rewind() will advance to the first yield (and ignore its value), the send() will

// advance to the second yield (and dump its value). Thus we loose the first yielded value!

通过添加 beforeFirstYieldcondition 我们可以确定 first yield 的值被返回。

蒋锴

翻译于 5年前

4人顶

顶翻译得不错哦！

调度器现在不得不比多任务循环要做稍微多点了，然后才运行多任务：

<?php

class Scheduler {

    protected $maxTaskId = 0;

    protected $taskMap = []; // taskId => task

    protected $taskQueue;

    public function __construct() {

        $this->taskQueue = new SplQueue();

    }

    public function newTask(Generator $coroutine) {

        $tid = ++$this->maxTaskId;

        $task = new Task($tid, $coroutine);

        $this->taskMap[$tid] = $task;

        $this->schedule($task);

        return $tid;

    }

    public function schedule(Task $task) {

        $this->taskQueue->enqueue($task);

    }

    public function run() {

        while (!$this->taskQueue->isEmpty()) {

            $task = $this->taskQueue->dequeue();

            $task->run();

            if ($task->isFinished()) {

                unset($this->taskMap[$task->getTaskId()]);

            } else {

                $this->schedule($task);

            }

        }

    }

}

newTask()方法（使用下一个空闲的任务id）创建一个新任务，然后把这个任务放入任务映射数组里。接着它通过把任务放入任务队列里来实现对任务的调度。接着run()方法扫描任务队列，运行任务。如果一个任务结束了，那么它将从队列里删除，否则它将在队列的末尾再次被调度。
让我们看看下面具有两个简单（并且没有什么意义）任务的调度器：

<?php

function task1() {

    for ($i = 1; $i <= 10; ++$i) {

        echo "This is task 1 iteration $i.\n";

        yield;

    }

}

function task2() {

    for ($i = 1; $i <= 5; ++$i) {

        echo "This is task 2 iteration $i.\n";

        yield;

    }

}

$scheduler = new Scheduler;

$scheduler->newTask(task1());

$scheduler->newTask(task2());

$scheduler->run();

两个任务都仅仅回显一条信息，然后使用yield把控制回传给调度器。输出结果如下：

This is task 1 iteration 1.

This is task 2 iteration 1.

This is task 1 iteration 2.

This is task 2 iteration 2.

This is task 1 iteration 3.

This is task 2 iteration 3.

This is task 1 iteration 4.

This is task 2 iteration 4.

This is task 1 iteration 5.

This is task 2 iteration 5.

This is task 1 iteration 6.

This is task 1 iteration 7.

This is task 1 iteration 8.

This is task 1 iteration 9.

This is task 1 iteration 10.

输出确实如我们所期望的：对前五个迭代来说，两个任务是交替运行的，接着第二个任务结束后，只有第一个任务继续运行。

几点人

翻译于 5年前

4人顶

顶翻译得不错哦！

与调度器之间通信

既然调度器已经运行了，那么我们就转向日程表的下一项：任务和调度器之间的通信。我们将使用进程用来和操作系统会话的同样的方式来通信：系统调用。我们需要系统调用的理由是操作系统与进程相比它处在不同的权限级别上。因此为了执行特权级别的操作（如杀死另一个进程），就不得不以某种方式把控制传回给内核，这样内核就可以执行所说的操作了。再说一遍，这种行为在内部是通过使用中断指令来实现的。过去使用的是通用的int指令，如今使用的是更特殊并且更快速的syscall/sysenter指令。

我们的任务调度系统将反映这种设计：不是简单地把调度器传递给任务（这样久允许它做它想做的任何事），我们将通过给yield表达式传递信息来与系统调用通信。这儿yield即是中断，也是传递信息给调度器（和从调度器传递出信息）的方法。

几点人

翻译于 5年前

3人顶

顶翻译得不错哦！

为了说明系统调用，我将对可调用的系统调用做一个小小的封装：

<?php

class SystemCall {

    protected $callback;

    public function __construct(callable $callback) {

        $this->callback = $callback;

    }

    public function __invoke(Task $task, Scheduler $scheduler) {

        $callback = $this->callback; // Can't call it directly in PHP :/

        return $callback($task, $scheduler);

    }

}

它将像其他任何可调用那样(使用_invoke)运行，不过它要求调度器把正在调用的任务和自身传递给这个函数。为了解决这个问题我们不得不微微的修改调度器的run方法：

<?php

public function run() {

    while (!$this->taskQueue->isEmpty()) {

        $task = $this->taskQueue->dequeue();

        $retval = $task->run();

        if ($retval instanceof SystemCall) {

            $retval($task, $this);

            continue;

        }

        if ($task->isFinished()) {

            unset($this->taskMap[$task->getTaskId()]);

        } else {

            $this->schedule($task);

        }

    }

}

第一个系统调用除了返回任务ID外什么都没有做：

<?php

function getTaskId() {

    return new SystemCall(function(Task $task, Scheduler $scheduler) {

        $task->setSendValue($task->getTaskId());

        $scheduler->schedule($task);

    });

}

这个函数确实设置任务id为下一次发送的值，并再次调度了这个任务。由于使用了系统调用，所以调度器不能自动调用任务，我们需要手工调度任务（稍后你将明白为什么这么做）。要使用这个新的系统调用的话，我们要重新编写以前的例子：

<?php

function task($max) {

    $tid = (yield getTaskId()); // <-- here's the syscall!

    for ($i = 1; $i <= $max; ++$i) {

        echo "This is task $tid iteration $i.\n";

        yield;

    }

}

$scheduler = new Scheduler;

$scheduler->newTask(task(10));

$scheduler->newTask(task(5));

$scheduler->run();

这段代码将给出与前一个例子相同的输出。注意系统调用同其他任何调用一样正常地运行，不过预先增加了yield。要创建新的任务，然后再杀死它们的话，需要两个以上的系统调用：

<?php

function newTask(Generator $coroutine) {

    return new SystemCall(

        function(Task $task, Scheduler $scheduler) use ($coroutine) {

            $task->setSendValue($scheduler->newTask($coroutine));

            $scheduler->schedule($task);

        }

    );

}

function killTask($tid) {

    return new SystemCall(

        function(Task $task, Scheduler $scheduler) use ($tid) {

            $task->setSendValue($scheduler->killTask($tid));

            $scheduler->schedule($task);

        }

    );

}

killTask函数需要在调度器里增加一个方法：

<?php

public function killTask($tid) {

    if (!isset($this->taskMap[$tid])) {

        return false;

    }

    unset($this->taskMap[$tid]);

    // This is a bit ugly and could be optimized so it does not have to walk the queue,

    // but assuming that killing tasks is rather rare I won't bother with it now

    foreach ($this->taskQueue as $i => $task) {

        if ($task->getTaskId() === $tid) {

            unset($this->taskQueue[$i]);

            break;

        }

    }

    return true;

}

用来测试新功能的微脚本：

<?php

function childTask() {

    $tid = (yield getTaskId());

    while (true) {

        echo "Child task $tid still alive!\n";

        yield;

    }

}

function task() {

    $tid = (yield getTaskId());

    $childTid = (yield newTask(childTask()));

    for ($i = 1; $i <= 6; ++$i) {

        echo "Parent task $tid iteration $i.\n";

        yield;

        if ($i == 3) yield killTask($childTid);

    }

}

$scheduler = new Scheduler;

$scheduler->newTask(task());

$scheduler->run();

这段代码将打印以下信息：

Parent task 1 iteration 1.

Child task 2 still alive!

Parent task 1 iteration 2.

Child task 2 still alive!

Parent task 1 iteration 3.

Child task 2 still alive!

Parent task 1 iteration 4.

Parent task 1 iteration 5.

Parent task 1 iteration 6.

PHP 使用协同程序实现合作多任务的更多相关文章

【转】Unity中的协同程序-使用Promise进行封装（二）
原文:http://gad.qq.com/program/translateview/7170970 译者:王磊(未来的未来) 审校:崔国军(飞扬971) 在上一篇文章中,我们的注意力主要是 ...
Lua 学习笔记（九）协同程序（线程thread）
协同程序与线程thread差不多,也就是一条执行序列,拥有自己独立的栈.局部变量和命令指针,同时又与其他协同程序共享全局变量和其他大部分东西.从概念上讲线程与协同程序的主要区别在于,一个具有多个线程的 ...
Unity3D协同程序（Coroutine）
摘要下: 1. coroutine, 中文翻译"协程".这个概念可能有点冷门,不过百度之,说是一种很古老的编程模型了,以前的操作系统里进程调度里用到过,现在操作系统的进程调度都是根 ...
【转】Unity中的协同程序-使用Promise进行封装（三）
原文:http://gad.qq.com/program/translateview/7170967 译者:崔国军(飞扬971) 审校:王磊(未来的未来) 在这个系列的最后一部分文章,我们要通过 ...
【转】Unity中的协同程序-使用Promise进行封装（一）
原文:http://gad.qq.com/program/translateview/7170767 译者:陈敬凤(nunu) 审校:王磊(未来的未来) 每个Unity的开发者应该都对协同程序非 ...
【转】关于Unity协同程序(Coroutine)的全面解析
http://www.unity.5helpyou.com/2658.html 本篇文章我们学习下unity3d中协程Coroutine的的原理及使用 1.什么是协调程序 unity协程是一个能暂停执 ...
Lua中的协同程序 coroutine
Lua中的协程和多线程很相似,每一个协程有自己的堆栈,自己的局部变量,可以通过yield-resume实现在协程间的切换.不同之处是:Lua协程是非抢占式的多线程,必须手动在不同的协程间切换,且同一时 ...
Unity 中的协同程序
今天咱就说说,协同程序coroutine.(这文章是在网吧敲的,没有unity,但是所有结论都被跑过,不管你信得过我还是信不过我,都要自己跑一下看看,同时欢迎纠错)先说说啥是协程:协同程序是一个非常让 ...
9. MonoBehaviour.StartCoroutine 开始协同程序
function StartCoroutine (routine : IEnumerator) : Coroutine 描述:开始协同程序. 一个协同程序在执行过程中,可以在任意位置使用yield语句 ...

随机推荐

torodb docker 运行试用
torodb 可以方便的让你迁移到pg,同时使用标准原生的sql 查询使用官方的docker-compose 进行测试环境准备 docker-compose 文件 wget https://raw ...
statik golang 静态资源嵌入二进制文件工具使用（docker 构建)
将静态资源打包进二进制文件有好多方便的地方方便客户演示代码简单加密运行方便 statik 就是一款在golang 中用的比较多,nodejs 有一款pkg (oclif 就推荐使用此工具) ...
JAVA中@SuppressWarnings注解的作用
eclipse中开发JAVA代码时,经常会出现编译告警符号,影响代码可读性,也影响调试的断点符号正常显示,可以使用@SuppressWarnings注解来抑制这些告警符号的再现.1.抑制单个类型的告警 ...
hadoop之 reduce个数控制
1.参数变更1.x 参数名 2.x 参数名 mapred.tasktracker.red ...
Linq to sql 增删改查（转帖）
http://blog.csdn.net/pan_junbiao/article/details/7015633 (LINQ To SQL 语法及实例大全) 代码 Code highlightin ...
Angular 4 延缓加载组件
1. 创建App ng new lazySample --routing 在app组件中的定义路由 2. 创建“Lazy” Module ng g module lazy --flat ng g co ...
C语言扩展动态内存报错：realloc(): invalid next size: 0x0000000002365010 ***
晚上被这个内存扩展崩溃的问题折腾的有点崩溃,当答案揭晓的那一刻,恍然大悟,原来如此简单. 练习题目:输入一个字符串,根据字母进行排序,说白了就是一个简单的冒泡 #include <stdio.h ...
Maven 生成项目站点
Maven 不仅仅时一个自动化构建工具和一个依赖管理工具,他还能够帮助聚合项目信息,促进团队间的交流,POM 可以包含各种项目信息,如项目描述.版本控制系统地址.缺陷跟踪系统地址.许可证信息.开发者信 ...
对比两个表中，字段名不一样的SQL
需要包括有几种情况一.A表中有的字段B表无二.B表有的A表无三.两个表字段名不一致的 --------------------------------------------------------- ...
Hadoop专业解决方案-第1章大数据和Hadoop生态圈
一.前言: 非常感谢Hadoop专业解决方案群:313702010,兄弟们的大力支持,在此说一声辛苦了,经过两周的努力,已经有啦初步的成果,目前第1章大数据和Hadoop生态圈小组已经翻译完成,在此 ...

PHP 使用协同程序实现合作多任务

与调度器之间通信

PHP 使用协同程序实现合作多任务的更多相关文章

随机推荐

热门专题