PHP一直以来以草根示人,它简单,易学,被大量应用于web开发,非常可惜的是大部分开发都在简单的增删改查,或者加上pdo,redis等客户端甚至分布式,以及规避语言本身的缺陷。然而这实在太委屈PHP了。记得有一次问walker,PHP能做什么?他说:什么都能做啊!当时我就震惊了,这怎么可能。。。直到后来一直看workerman源码,发现PHP原来有很多不为大家所知的诸多用法,包括多进程(还有线程)、信号处理、namespace等等一大堆特点。而workerman正是这些很少被使用特性(或者说扩展)的集大成者,如果非要说它的缺点,那就是PHP的缺点了,当然PHP的优点它全占了~而且PHP7发布在即,workerman必将得到更多的优化,搭配HHVM更是叼的不行。

workerman

  版本:3.1.8(linux)

  模型:GatewayWorker(Worker模型可与之类比)

  注:只贴出讲解部分代码,出处以文件名形式给出,大家可自行查看

  workerman最初只开发了Linux版本,win是后来增加的,基于命令行模式运行(cli)

多进程模型

  工作进程,Master、Gateway和Worker,Gateway主要用于处理IO事件,保存客户端链接状态,将数据处理请求发送给Worker等工作,Worker则是完全的业务逻辑处理,前者为IO密集型,后者为计算密集型,它们之间通过网络通信,Gateway和Worker两两间注册通信地址,所以非常方便的进行分布式部署,如果业务处理量大可以单纯的增加Worker服务。

  

  它们有一个负责监听的父进程(Master),监听子进程状态,发送 signal 给子进程,接受来自终端的命令、信号等工作。父进程可以说是整个系统启动后的入口。

启动命令解析

  既然以命令模式(cli)运行(注意与 fpm 的区别,后者处理来自网页端的请求),就必然有一个启动脚本解析命令,譬如说3.x版本(之前默认为daemon)新增一个 -d 参数,以表示守护进程运行,解析到该参数设置 self::$daemon = true, 随后fork子进程以脱离当前进程组,设置进程组组长等工作。这里有两个非常重要的参数 $argc 和 $argc,前者表示参数个数,后者为一个数组,保存有命令的所有参数,比如:sudo php start.php start -d,$argv就是 array( [0]=>start.php, [1]=>start, [2]=>-d ),而解析主要用到$argv。

  启动主要执行下面步骤:

  1. 包含自动加载器 Autoloader ,加载各 Application 下启动文件;
  2. 设置 _appInitPath 根目录;
  3. 解析,初始化参数,执行相应命令。

下面是具体实现(workerman/worker.php):

     public static function parseCommand()
{
// 检查运行命令的参数
global $argv;
$start_file = $argv[0]; // 命令
$command = trim($argv[1]); // 子命令,目前只支持-d
$command2 = isset($argv[2]) ? $argv[2] : ''; // 检查主进程是否在运行
$master_pid = @file_get_contents(self::$pidFile);
$master_is_alive = $master_pid && @posix_kill($master_pid, 0);
if($master_is_alive)
{
if($command === 'start')
{
self::log("Workerman[$start_file] is running");
}
}
elseif($command !== 'start' && $command !== 'restart')
{
self::log("Workerman[$start_file] not run");
} // 根据命令做相应处理
switch($command)
{
// 启动 workerman
case 'start':
if($command2 === '-d')
{
Worker::$daemonize = true;
}
break;
// 显示 workerman 运行状态
case 'status':
exit(0);
// 重启 workerman
case 'restart':
// 停止 workeran
case 'stop':
// 想主进程发送SIGINT信号,主进程会向所有子进程发送SIGINT信号
$master_pid && posix_kill($master_pid, SIGINT);
// 如果 $timeout 秒后主进程没有退出则展示失败界面
$timeout = 5;
$start_time = time();
while(1)
{
// 检查主进程是否存活
$master_is_alive = $master_pid && posix_kill($master_pid, 0);
if($master_is_alive)
{
// 检查是否超过$timeout时间
if(time() - $start_time >= $timeout)
{
self::log("Workerman[$start_file] stop fail");
exit;
}
usleep(10000);
continue;
}
self::log("Workerman[$start_file] stop success");
// 是restart命令
if($command === 'stop')
{
exit(0);
}
// -d 说明是以守护进程的方式启动
if($command2 === '-d')
{
Worker::$daemonize = true;
}
break;
}
break;
// 平滑重启 workerman
case 'reload':
exit;
}
}

walker代码注释已经非常详尽,下面有几点细节处:

  • 检查主进程是否存活:17行的逻辑与操作,如果主进程PID存在情况下,向该进程发送信号0,实际上并没有发送任何信息,只是检测该进程(或进程组)是否存活,同时也检测当前用户是否有权限发送系统信号;
  • 为什么主进程PID会保存?系统启动后脱离当前terminal运行,如果要执行关闭或者其他命令,此时是以另外的一个进程执行该命令,如果我们连进程PID都不知道,那该向谁发信号呢?!所以主进程PID必须保存起来,而且主进程负责监听其他子进程,所以它是我们继续操作的入口。

Worker::runAll()

  php的socket编程其实和C差不多,后者对socket进行了再包裹,并提供接口给php,在php下网络编程步骤大大减少。譬如:stream_socket_serverstream_socket_client 直接创建了server/client socke(php有两套socket操作函数)。wm则大量使用了前者,启动过程如下(注释已经非常详尽):

     public static function runAll()
{
// 初始化环境变量
self::init();
// 解析命令
self::parseCommand();
// 尝试以守护进程模式运行
self::daemonize();
// 初始化所有worker实例,主要是监听端口
self::initWorkers();
// 初始化所有信号处理函数
self::installSignal();
// 保存主进程pid
self::saveMasterPid();
// 创建子进程(worker进程)并运行
self::forkWorkers();
// 展示启动界面
self::displayUI();
// 尝试重定向标准输入输出
self::resetStd();
// 监控所有子进程(worker进程)
self::monitorWorkers();
}

  下面还是只说该过程的关键点:

  1. 初始化环境变量,例如设置主进程名称、日志路径,初始化定时器等等;
  2. 解析命令行参数,主要用到 $argc 和 $argc 用法同C语言;
  3. 生成守护进程,以脱离当前终端(两年前大部分认为PHP无法做daemon,其实这是个误区!其实PHP在linux的进程模型很稳定,现在wm在商业的应用已经非常成熟,国内某公司每天处理几亿的连接,用于订单、支付调用,大家可以打消顾虑了);
  4. 初始化所有worker实例(注意,这里是在主进程做的,只是生成了一堆 server 并没有设置监听,多进程模型是在子进程做的监听,即IO复用);
  5. 为主进程注册信号处理函数;
  6. 保存主进程PID,当系统运行后,我们在终端查看系统状态或者执行关闭、重启命令,是通过主进程进行通信,所以需要知道主进程PID,我们知道在终端下敲入一个可执行命令,实则是在当前终端下新建一个子进程来执行,所以我们需要得知主进程PID,以向WM主进程发送SIGNAL,这时信号处理函数捕获该信号,并通过回调方式执行。
  7. 创建子进程,设置当前进程用户(root)。在多进程模型中,两类子进程,分别监听不同的server地址,我们在主进程只是创建server并没有设置监听,也没有生成指定数目的server,原因在于,我们在一个进程多次创建同一个 socket,会报错, worker数目其实就是 socket 数量,也就是该 socket 的子进程数目,子进程继承了父进程上下文,但是只监听特定的 socket 事件;
  8. 在子进程中,将 server socket 注册监听事件,用到一个扩展Event,可以实现IO复用,并注册数据读取回调,同时也可注册socket连接事件回调;
  9. 输入输出重定向;
  10. 主进程监听子进程状态,在一个无限循环中调用 pcntl_signal_dispatch() 函数,用于捕获子进程退出状态,该函数会一直阻塞,直到有子进程退出时才触发;

  至此,一个完整的启动过程大致处理完成,然后 server 会一直运行,一直等待 socket 连接事件,等待数据可读可写事件,通过事先注册的处理函数,就能完整的处理整个网络过程。

结束语

  其实网络编程过程大致都差不多,这些都有标准答案,每个语言实现的大致过程基本相同,当然类似 golang 的 goroutine 另说。。。需要了解应用层协议(如果可能,需要手动解包和封包),网络模型,TCP/UDP,进程间通信,IO复用等等,当然最重要的是会 debug。。。自己动手尝试写一个简单的 server 就会遇到很多无法遇见的坑,所以纸上得来终觉浅,绝知此事要躬行。

  

workerman源码分析之启动过程的更多相关文章

  1. mybatis源码分析:启动过程

    mybatis在开发中作为一个ORM框架使用的比较多,所谓ORM指的是Object Relation Mapping,直译过来就是对象关系映射,这个映射指的是java中的对象和数据库中的记录的映射,也 ...

  2. Nimbus<三>Storm源码分析--Nimbus启动过程

    Nimbus server, 首先从启动命令开始, 同样是使用storm命令"storm nimbus”来启动看下源码, 此处和上面client不同, jvmtype="-serv ...

  3. elasticSearch6源码分析(1)启动过程

    1.找到bin目录,下面有elasticSearch的sh文件,查看执行过程 exec \ "$JAVA" \ $ES_JAVA_OPTS \ -Des.path.home=&qu ...

  4. Linux内核源码分析--内核启动之(3)Image内核启动(C语言部分)(Linux-3.0 ARMv7)

    http://blog.chinaunix.net/uid-20543672-id-3157283.html Linux内核源码分析--内核启动之(3)Image内核启动(C语言部分)(Linux-3 ...

  5. SOFA 源码分析 —— 服务引用过程

    前言 在前面的 SOFA 源码分析 -- 服务发布过程 文章中,我们分析了 SOFA 的服务发布过程,一个完整的 RPC 除了发布服务,当然还需要引用服务. So,今天就一起来看看 SOFA 是如何引 ...

  6. Dubbo 源码分析 - 服务调用过程

    注: 本系列文章已捐赠给 Dubbo 社区,你也可以在 Dubbo 官方文档中阅读本系列文章. 1. 简介 在前面的文章中,我们分析了 Dubbo SPI.服务导出与引入.以及集群容错方面的代码.经过 ...

  7. u-boot 源码分析(1) 启动过程分析

    u-boot 源码分析(1) 启动过程分析 文章目录 u-boot 源码分析(1) 启动过程分析 前言 配置 源码结构 api arch board common cmd drivers fs Kbu ...

  8. v87.01 鸿蒙内核源码分析 (内核启动篇) | 从汇编到 main () | 百篇博客分析 OpenHarmony 源码

    本篇关键词:内核重定位.MMU.SVC栈.热启动.内核映射表 内核汇编相关篇为: v74.01 鸿蒙内核源码分析(编码方式) | 机器指令是如何编码的 v75.03 鸿蒙内核源码分析(汇编基础) | ...

  9. Appium Server 源码分析之启动运行Express http服务器

    通过上一个系列Appium Android Bootstrap源码分析我们了解到了appium在安卓目标机器上是如何通过bootstrap这个服务来接收appium从pc端发送过来的命令,并最终使用u ...

随机推荐

  1. Thinkphp5 Auth权限认证

    Thinkphp5 Auth权限认证 一.总结 一句话总结:四表两组关系,一个多对多(权限和用户组之间),一个一对多(用户和用户组之间) 二.Thinkphp5 Auth权限认证 auth类在thin ...

  2. js进阶 10-8 伪类选择器有哪几类(自己不用,永远不是自己的)

    js进阶 10-8 伪类选择器有哪几类(自己不用,永远不是自己的) 一.总结 一句话总结:自己不用,永远不是自己的. 0.学而不用,却是为何? 自己不用,永远不是自己的,有需求的时候要想到它,然后操作 ...

  3. MySQL忘记root密码不重启mysqld的方法

    MySQL忘记root密码不重启mysqld的方法   1.首先得有一个可以拥有修改权限的mysql数据库账号,当前的mysql实例账号(较低权限的账号,比如可以修改zabbix数据库)或者其他相同版 ...

  4. easyui样式及js导入顺序及刷新回车的问题

    在使用easyui时,需要导入样式表及其js文件,在导入时.不光要遵守jquery包在easyui包的前面,还需要把样式表放在js的前边 <link type="text/css&qu ...

  5. Java String对象的经典问题(转)

    public class StringTest { public static void main(String[] args) { String strA = "abc"; St ...

  6. 在CentOS系统上将deb包转换为rpm包

    转载自 http://www.heminjie.com/system/linux/1487.html deb文件格式本是ubuntu/debian系统下的安装文件,那么我想要在redhat/cento ...

  7. HSSFWorkBooK用法 ---Excel表的导出和设置

    public ActionResult excelPrint() { HSSFWorkbook workbook = new HSSFWorkbook();// 创建一个Excel文件 HSSFShe ...

  8. Bit error testing and training in double data rate (ddr) memory system

    DDR PHY interface bit error testing and training is provided for Double Data Rate memory systems. An ...

  9. DELPHI高性能大容量SOCKET并发(四):粘包、分包、解包

    粘包 使用TCP长连接就会引入粘包的问题,粘包是指发送方发送的若干包数据到接收方接收时粘成一包,从接收缓冲区看,后一包数据的头紧接着前一包数据的尾.粘包可能由发送方造成,也可能由接收方造成.TCP为提 ...

  10. Codeforces 449 B. Jzzhu and Cities

    堆优化dijkstra,假设哪条铁路能够被更新,就把相应铁路删除. B. Jzzhu and Cities time limit per test 2 seconds memory limit per ...