workerman源码分析之启动过程
PHP一直以来以草根示人,它简单,易学,被大量应用于web开发,非常可惜的是大部分开发都在简单的增删改查,或者加上pdo,redis等客户端甚至分布式,以及规避语言本身的缺陷。然而这实在太委屈PHP了。记得有一次问walker,PHP能做什么?他说:什么都能做啊!当时我就震惊了,这怎么可能。。。直到后来一直看workerman源码,发现PHP原来有很多不为大家所知的诸多用法,包括多进程(还有线程)、信号处理、namespace等等一大堆特点。而workerman正是这些很少被使用特性(或者说扩展)的集大成者,如果非要说它的缺点,那就是PHP的缺点了,当然PHP的优点它全占了~而且PHP7发布在即,workerman必将得到更多的优化,搭配HHVM更是叼的不行。
workerman
版本:3.1.8(linux)
模型:GatewayWorker(Worker模型可与之类比)
注:只贴出讲解部分代码,出处以文件名形式给出,大家可自行查看
workerman最初只开发了Linux版本,win是后来增加的,基于命令行模式运行(cli)。
多进程模型
工作进程,Master、Gateway和Worker,Gateway主要用于处理IO事件,保存客户端链接状态,将数据处理请求发送给Worker等工作,Worker则是完全的业务逻辑处理,前者为IO密集型,后者为计算密集型,它们之间通过网络通信,Gateway和Worker两两间注册通信地址,所以非常方便的进行分布式部署,如果业务处理量大可以单纯的增加Worker服务。
它们有一个负责监听的父进程(Master),监听子进程状态,发送 signal 给子进程,接受来自终端的命令、信号等工作。父进程可以说是整个系统启动后的入口。
启动命令解析
既然以命令模式(cli)运行(注意与 fpm 的区别,后者处理来自网页端的请求),就必然有一个启动脚本解析命令,譬如说3.x版本(之前默认为daemon)新增一个 -d 参数,以表示守护进程运行,解析到该参数设置 self::$daemon = true, 随后fork子进程以脱离当前进程组,设置进程组组长等工作。这里有两个非常重要的参数 $argc 和 $argc,前者表示参数个数,后者为一个数组,保存有命令的所有参数,比如:sudo php start.php start -d,$argv就是 array( [0]=>start.php, [1]=>start, [2]=>-d ),而解析主要用到$argv。
启动主要执行下面步骤:
- 包含自动加载器 Autoloader ,加载各 Application 下启动文件;
- 设置 _appInitPath 根目录;
- 解析,初始化参数,执行相应命令。
下面是具体实现(workerman/worker.php):
public static function parseCommand()
{
// 检查运行命令的参数
global $argv;
$start_file = $argv[0]; // 命令
$command = trim($argv[1]); // 子命令,目前只支持-d
$command2 = isset($argv[2]) ? $argv[2] : ''; // 检查主进程是否在运行
$master_pid = @file_get_contents(self::$pidFile);
$master_is_alive = $master_pid && @posix_kill($master_pid, 0);
if($master_is_alive)
{
if($command === 'start')
{
self::log("Workerman[$start_file] is running");
}
}
elseif($command !== 'start' && $command !== 'restart')
{
self::log("Workerman[$start_file] not run");
} // 根据命令做相应处理
switch($command)
{
// 启动 workerman
case 'start':
if($command2 === '-d')
{
Worker::$daemonize = true;
}
break;
// 显示 workerman 运行状态
case 'status':
exit(0);
// 重启 workerman
case 'restart':
// 停止 workeran
case 'stop':
// 想主进程发送SIGINT信号,主进程会向所有子进程发送SIGINT信号
$master_pid && posix_kill($master_pid, SIGINT);
// 如果 $timeout 秒后主进程没有退出则展示失败界面
$timeout = 5;
$start_time = time();
while(1)
{
// 检查主进程是否存活
$master_is_alive = $master_pid && posix_kill($master_pid, 0);
if($master_is_alive)
{
// 检查是否超过$timeout时间
if(time() - $start_time >= $timeout)
{
self::log("Workerman[$start_file] stop fail");
exit;
}
usleep(10000);
continue;
}
self::log("Workerman[$start_file] stop success");
// 是restart命令
if($command === 'stop')
{
exit(0);
}
// -d 说明是以守护进程的方式启动
if($command2 === '-d')
{
Worker::$daemonize = true;
}
break;
}
break;
// 平滑重启 workerman
case 'reload':
exit;
}
}
walker代码注释已经非常详尽,下面有几点细节处:
- 检查主进程是否存活:17行的逻辑与操作,如果主进程PID存在情况下,向该进程发送信号0,实际上并没有发送任何信息,只是检测该进程(或进程组)是否存活,同时也检测当前用户是否有权限发送系统信号;
- 为什么主进程PID会保存?系统启动后脱离当前terminal运行,如果要执行关闭或者其他命令,此时是以另外的一个进程执行该命令,如果我们连进程PID都不知道,那该向谁发信号呢?!所以主进程PID必须保存起来,而且主进程负责监听其他子进程,所以它是我们继续操作的入口。
Worker::runAll()
php的socket编程其实和C差不多,后者对socket进行了再包裹,并提供接口给php,在php下网络编程步骤大大减少。譬如:stream_socket_server 和 stream_socket_client 直接创建了server/client socke(php有两套socket操作函数)。wm则大量使用了前者,启动过程如下(注释已经非常详尽):
public static function runAll()
{
// 初始化环境变量
self::init();
// 解析命令
self::parseCommand();
// 尝试以守护进程模式运行
self::daemonize();
// 初始化所有worker实例,主要是监听端口
self::initWorkers();
// 初始化所有信号处理函数
self::installSignal();
// 保存主进程pid
self::saveMasterPid();
// 创建子进程(worker进程)并运行
self::forkWorkers();
// 展示启动界面
self::displayUI();
// 尝试重定向标准输入输出
self::resetStd();
// 监控所有子进程(worker进程)
self::monitorWorkers();
}
下面还是只说该过程的关键点:
- 初始化环境变量,例如设置主进程名称、日志路径,初始化定时器等等;
- 解析命令行参数,主要用到 $argc 和 $argc 用法同C语言;
- 生成守护进程,以脱离当前终端(两年前大部分认为PHP无法做daemon,其实这是个误区!其实PHP在linux的进程模型很稳定,现在wm在商业的应用已经非常成熟,国内某公司每天处理几亿的连接,用于订单、支付调用,大家可以打消顾虑了);
- 初始化所有worker实例(注意,这里是在主进程做的,只是生成了一堆 server 并没有设置监听,多进程模型是在子进程做的监听,即IO复用);
- 为主进程注册信号处理函数;
- 保存主进程PID,当系统运行后,我们在终端查看系统状态或者执行关闭、重启命令,是通过主进程进行通信,所以需要知道主进程PID,我们知道在终端下敲入一个可执行命令,实则是在当前终端下新建一个子进程来执行,所以我们需要得知主进程PID,以向WM主进程发送SIGNAL,这时信号处理函数捕获该信号,并通过回调方式执行。
- 创建子进程,设置当前进程用户(root)。在多进程模型中,两类子进程,分别监听不同的server地址,我们在主进程只是创建server并没有设置监听,也没有生成指定数目的server,原因在于,我们在一个进程多次创建同一个 socket,会报错, worker数目其实就是 socket 数量,也就是该 socket 的子进程数目,子进程继承了父进程上下文,但是只监听特定的 socket 事件;
- 在子进程中,将 server socket 注册监听事件,用到一个扩展Event,可以实现IO复用,并注册数据读取回调,同时也可注册socket连接事件回调;
- 输入输出重定向;
- 主进程监听子进程状态,在一个无限循环中调用 pcntl_signal_dispatch() 函数,用于捕获子进程退出状态,该函数会一直阻塞,直到有子进程退出时才触发;
至此,一个完整的启动过程大致处理完成,然后 server 会一直运行,一直等待 socket 连接事件,等待数据可读可写事件,通过事先注册的处理函数,就能完整的处理整个网络过程。
结束语
其实网络编程过程大致都差不多,这些都有标准答案,每个语言实现的大致过程基本相同,当然类似 golang 的 goroutine 另说。。。需要了解应用层协议(如果可能,需要手动解包和封包),网络模型,TCP/UDP,进程间通信,IO复用等等,当然最重要的是会 debug。。。自己动手尝试写一个简单的 server 就会遇到很多无法遇见的坑,所以纸上得来终觉浅,绝知此事要躬行。
workerman源码分析之启动过程的更多相关文章
- mybatis源码分析:启动过程
mybatis在开发中作为一个ORM框架使用的比较多,所谓ORM指的是Object Relation Mapping,直译过来就是对象关系映射,这个映射指的是java中的对象和数据库中的记录的映射,也 ...
- Nimbus<三>Storm源码分析--Nimbus启动过程
Nimbus server, 首先从启动命令开始, 同样是使用storm命令"storm nimbus”来启动看下源码, 此处和上面client不同, jvmtype="-serv ...
- elasticSearch6源码分析(1)启动过程
1.找到bin目录,下面有elasticSearch的sh文件,查看执行过程 exec \ "$JAVA" \ $ES_JAVA_OPTS \ -Des.path.home=&qu ...
- Linux内核源码分析--内核启动之(3)Image内核启动(C语言部分)(Linux-3.0 ARMv7)
http://blog.chinaunix.net/uid-20543672-id-3157283.html Linux内核源码分析--内核启动之(3)Image内核启动(C语言部分)(Linux-3 ...
- SOFA 源码分析 —— 服务引用过程
前言 在前面的 SOFA 源码分析 -- 服务发布过程 文章中,我们分析了 SOFA 的服务发布过程,一个完整的 RPC 除了发布服务,当然还需要引用服务. So,今天就一起来看看 SOFA 是如何引 ...
- Dubbo 源码分析 - 服务调用过程
注: 本系列文章已捐赠给 Dubbo 社区,你也可以在 Dubbo 官方文档中阅读本系列文章. 1. 简介 在前面的文章中,我们分析了 Dubbo SPI.服务导出与引入.以及集群容错方面的代码.经过 ...
- u-boot 源码分析(1) 启动过程分析
u-boot 源码分析(1) 启动过程分析 文章目录 u-boot 源码分析(1) 启动过程分析 前言 配置 源码结构 api arch board common cmd drivers fs Kbu ...
- v87.01 鸿蒙内核源码分析 (内核启动篇) | 从汇编到 main () | 百篇博客分析 OpenHarmony 源码
本篇关键词:内核重定位.MMU.SVC栈.热启动.内核映射表 内核汇编相关篇为: v74.01 鸿蒙内核源码分析(编码方式) | 机器指令是如何编码的 v75.03 鸿蒙内核源码分析(汇编基础) | ...
- Appium Server 源码分析之启动运行Express http服务器
通过上一个系列Appium Android Bootstrap源码分析我们了解到了appium在安卓目标机器上是如何通过bootstrap这个服务来接收appium从pc端发送过来的命令,并最终使用u ...
随机推荐
- 【54.38%】【BZOJ 4300】绝世好题
Time Limit: 1 Sec Memory Limit: 128 MB Submit: 1120 Solved: 609 [Submit][Status][Discuss] Descript ...
- JNDI 的理解
JNDI是 Java 命名与文件夹接口(Java Naming and Directory Interface),在J2EE规范中是重要的规范之中的一个,不少专家觉得,没有透彻理解JNDI的意义和作用 ...
- git自己操作命令组集合
git自己操作命令组集合 一.总结 一句话总结: 1.官方有非常详细的中文文档资料,任何组件或者插件记得看有没有文档资料,这个用起来快,配合百度. 2.git clone命令是直接把git仓库上面的代 ...
- Oracle数据库分页查询的几种实现方法
没有Sql Server有top那么好用,但是Oracle含有隐藏的rownum列可以灵活使用,使实现分页效果,pageSize默认10行 方法一: select * from test where ...
- 学习鸟哥的Linux私房菜笔记(9)——bash1
一.Shell简介 Shell :命令行解释器,是用户与系统沟通时的媒介 在Unix系统中有各种Shell, Linux采用bash为其默认shell 系统可以使用的shell记录在 /etc/she ...
- cordova通过指纹插件进行指纹验证
原文:cordova通过指纹插件进行指纹验证 版权声明:本文为博主原创文章,转载须注明出处,博客地址:https://blog.csdn.net/wx13227855087 https://blog. ...
- 再议指针---------函数回调(qsort函数原理)
我们是否能写一个这种函数: 能够对不论什么类型数据排序 不论什么人在使用该函数不须要改动该函数代码(即:用户能够不必看到函数源 码,仅仅会调用即可) 思考: 用户须要排序的数据的类型千变万化,可能是i ...
- .NET 中使用 Mutex 进行跨越进程边界的同步 - walterlv
原文:.NET 中使用 Mutex 进行跨越进程边界的同步 - walterlv .NET 中使用 Mutex 进行跨越进程边界的同步 2018-12-30 08:41 Mutex 是 Mutual ...
- Qt自定义密码框,先显示后隐藏(继承以后改写slot即可,即与哪个相近就改写哪个)good
现在很多应用在密码输入时,会先显示一段时间,大概几百毫秒,然后再变成星号或者圆点隐藏起来.这样做的好处是,可以让密码输入者看到自己输入的字符,同时又防止密码被偷窥.但是Qt自带的密码输入框,要么输入时 ...
- 买不起360随声wifi怎么办?这些都不是问题
只需轻松一步,点击开启共享 软件下载地址:http://download.csdn.net/detail/lxq_xsyu/6384265 如果身边没有数据线怎么办?? 使用方法: 1.用手机连接Wi ...