php多进程总结
场景:日常任务中,有时需要通过php脚本执行一些日志分析,队列处理等任务,当数据量比较大时,可以使用多进程来处理。
准备:php多进程需要pcntl,posix扩展支持,可以通过 php - m 查看,没安装的话需要重新编译php,加上参数--enable-pcntl,posix一般默认会有。
注意:
多进程实现只能在cli模式下,在web服务器环境下,会出现无法预期的结果,我测试报错:
Call to undefined function: pcntl_fork()
一个错误 pcntl_fork causing “errno=32 Broken pipe” #474 ,看https://github.com/phpredis/phpredis/issues/474
注意两点:如果是在循环中创建子进程,那么子进程中最后要exit,防止子进程进入循环。
子进程中的打开连接不能拷贝,使用的还是主进程的,需要用多例模式。
pcntl_fork:
一次调用两次返回,在父进程中返回子进程pid,在子进程中返回0,出错返回-1。
pcntl_wait ( int &$status [, int $options ] ):
阻塞当前进程,直到任意一个子进程退出或收到一个结束当前进程的信号,注意是结束当前进程的信号,子进程结束发送的SIGCHLD不算。使用$status返回子进程的状态码,并可以指定第二个参数来说明是否以阻塞状态调用
阻塞方式调用的,函数返回值为子进程的pid,如果没有子进程返回值为-1;
非阻塞方式调用,函数还可以在有子进程在运行但没有结束的子进程时返回0。
/** 确保这个函数只能运行在SHELL中 */
if (substr(php_sapi_name(), 0, 3) !== 'cli') {
die("cli mode only");
}
#!/bin/bash for((i=;i<=;i++))
do
/usr/local/bin/php multiprocessTest.php &
done wait
上面的shell程序,列了一个很简单的多进程程序,用一个for循环,实现了8进程并发来跑multiprocessTest.php这个程序。最后的wait语句,也可以使主进程,再等待所有进程都执行完后再往下执行的需求。
这个程序是没有问题的,很多现有的代码也都这样实现,但是这个程序的并发数是不可控的,即我们无法根据机器的核数去调度每一个进程的开关。
若我们的机器有8核或者更多,上面的程序是没有问题的,所有核都能充分利用,并且互相之间,没有争抢资源的情况出现。
但我们的机器要没有8核的话会是什么情况,同一时间运行的进程数多于核数,那么系统就会出现进程分配调度的问题,争抢资源也跟着相应而来,一个进程不能保证独立连续的执行,所有的进程运行会听从系统的调度,这样就会有更多的不确定因素出现。
<?php //最大的子进程数量
$maxChildPro = 8; //当前的子进程数量
$curChildPro = 0; //当子进程退出时,会触发该函数,当前子进程数-1
function sig_handler($sig)
{
global $curChildPro;
switch ($sig) {
case SIGCHLD:
echo 'SIGCHLD', PHP_EOL;
$curChildPro--;
break;
}
} //配合pcntl_signal使用,简单的说,是为了让系统产生时间云,让信号捕捉函数能够捕捉到信号量
declare(ticks = 1); //注册子进程退出时调用的函数。SIGCHLD:在一个进程终止或者停止时,将SIGCHLD信号发送给其父进程。
pcntl_signal(SIGCHLD, "sig_handler"); while (true) {
$curChildPro++;
$pid = pcntl_fork();
if ($pid) {
//父进程运行代码,达到上限时父进程阻塞等待任一子进程退出后while循环继续
if ($curChildPro >= $maxChildPro) {
pcntl_wait($status);
}
} else {
//子进程运行代码
$s = rand(2, 6);
sleep($s);
echo "child sleep $s second quit", PHP_EOL;
exit;
}
}
<?php $childs = array(); // Fork10个子进程
for ($i = 0; $i < 10; $i++) {
$pid = pcntl_fork();
if ($pid == -1)
die('Could not fork'); if ($pid) {
echo "parent \n";
$childs[] = $pid;
} else {
// Sleep $i+1 (s). 子进程可以得到$i参数
sleep($i + 1); // 子进程需要exit,防止子进程也进入for循环
exit();
}
} while (count($childs) > 0) {
foreach ($childs as $key => $pid) {
$res = pcntl_waitpid($pid, $status, WNOHANG); //-1代表error, 大于0代表子进程已退出,返回的是子进程的pid,非阻塞时0代表没取到退出子进程
if ($res == -1 || $res > 0)
unset($childs[$key]);
} sleep(1);
}
<?php
function _fetchLog()
{
$password = $this->_getPassword();
$online_log_path = NginxConf::getArchiveDir($this->_stat_day);
$task_log_path = QFrameConfig::getConfig('LOG_PATH');
$children = array();
$success = true;
foreach($this->_server_list as $host => $value)
{
$local_dir = $this->_prepareLocalDir($host);
$task_log = "$task_log_path/fetch_log.$host";
$cmd = "sshpass -p $password rsync -av -e 'ssh -o StrictHostKeyChecking=no' $host:$online_log_path/* $local_dir >> $task_log 2>&1";
$pid = pcntl_fork();
if(-1 === $pid)
{
LogSvc::log('stat_pv_by_citycode_error', 'could not fork');
exit('could not fork');
}
else if(0 === $pid)
{
system($cmd, $return_value);
if(0 !== $return_value)
{
LogSvc::log('stat_pv_by_citycode_error', "rsync $host error");
}
exit($return_value);
}
else
{
$children[$pid] = 1;
}
}
while(!empty($children))
{
$pid = pcntl_waitpid(-1, $status, WNOHANG);
if(0 === $pid)
{
sleep(1);
}
else
{
if(0 !== pcntl_wexitstatus($status))
{
$success = false;
}
unset($children[$pid]);
}
}
return $success;
}
posix_kill(posix_getpid(), SIGHUP); 为自己生成SIGHUP信号
declare(ticks = 1); //php < 5.3
pcntl_signal()
函数仅仅是注册信号和它的处理方法,真正接收到信号并调用其处理方法的是pcntl_signal_dispatch()
函数必须在循环里调用,为了检测是否有新的信号等待dispatching。pcntl_signal_dispatch()
declare(ticks = 1);
表示每执行一条低级指令,就检查一次信号,如果检测到注册的信号,就调用其信号处理器。kill [PID]
命令,未加任何其他参数的话,程序会接收到一个SIGTERM信号。 <?php // 定义一个处理器,接收到SIGINT信号后只输出一行信息
function signalHandler($signal)
{
if ($signal == SIGINT) {
echo 'SIGINT', PHP_EOL;
}
} // 信号注册:当接收到SIGINT信号时,调用signalHandler()函数
pcntl_signal(SIGINT, 'signalHandler'); /**
* PHP < 5.3 使用
* 配合pcntl_signal使用,表示每执行一条低级指令,就检查一次信号,如果检测到注册的信号,就调用其信号处理器。
*/
if (!function_exists("pcntl_signal_dispatch")) {
declare(ticks=1);
} while (true) {
$s = sleep(10);
echo $s, PHP_EOL; //信号会唤醒sleep,返回剩余的秒数。 // do something
for ($i = 0; $i < 5; $i++) {
echo $i . PHP_EOL;
usleep(100000);
} /**
* PHP >= 5.3
* 调用已安装的信号处理器
* 必须在循环里调用,为了检测是否有新的信号等待dispatching。
*/
if (!function_exists("pcntl_signal_dispatch")) {
pcntl_signal_dispatch();
} }
<?php declare(ticks = 1); function signal_handler($signal) {
print "Caught SIGALRM\n";
pcntl_alarm(5);
} pcntl_signal(SIGALRM, "signal_handler", true);
pcntl_alarm(5); for(;;) {
}
<?php /**
* 父进程通过pcntl_wait等待子进程退出
* 子进程通过信号kill自己,也可以在父进程中发送kil信号结束子进程
*/ //生成子进程
$pid = pcntl_fork();
if($pid == -1){
die('could not fork');
}else{
if($pid){
$status = 0;
//阻塞父进程,直到子进程结束,不适合需要长时间运行的脚本.
//可使用pcntl_wait($status, WNOHANG)实现非阻塞式
pcntl_wait($status);
exit;
}else{
//结束当前子进程,以防止生成僵尸进程
if(function_exists("posix_kill")){
posix_kill(getmypid(), SIGTERM);
}else{
system('kill -9'. getmypid());
}
exit;
}
}
2. 使用kill函数,php中是posix_kill,向原有的父进程发送空信号(kill(pid, 0))。使用这个方法对某个进程的存在性进行检查,而不会真的发送信号。所以,如果这个函数返回-1表示父进程已经退出。
(1) 父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起。它不适合子进程需要长时间运行的情况(会导致超时)。
执行wait()或waitpid()系统调用,则子进程在终止后会立即把它在进程表中的数据返回给父进程,此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。
(2) 如果父进程很忙,那么可以用signal函数为SIGCHLD安装handler。在子进程结束后,父进程会收到该信号,可以在handler中调用wait回收。
(3) 如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCLD, SIG_IGN)或signal(SIGCHLD, SIG_IGN)通知内核,自己对子进程的结束不感兴趣,那么子进程结束后,内核会回收,并不再给父进程发送信号
(4)fork两次,父进程fork一个子进程,然后继续工作,子进程fork一个孙进程后退出,那么孙进程被init接管,孙进程结束后,init会回收。不过子进程的回收还要自己做。
ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'
命令注解:
-A 参数列出所有进程
-o 自定义输出字段 我们设定显示字段为 stat(状态), ppid(进程父id), pid(进程id),cmd(命令)这四个参数
状态为 z或者Z 的进程为僵尸进程,所以我们使用grep抓取stat状态为zZ进程
运行结果如下:
这时,可以使用 kill -HUP 5255 杀掉这个进程。如果再次查看僵尸进程还存在,可以kill -HUP 5253(父进程)。
如果有多个僵尸进程,可以通过
ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'|awk 'print{$2}'|xargs kill -9
处理。
多进程--进程间通信(IPC)
多进程--守护进程
多进程--socket实现简单TCP server
<?php static public function sendSDKMsg($version)
{/*{{{*/
if(!self::sendRandChance(self::EA_LAST_TIME_KEY.":".$version)) return false; $fp = @fsockopen( "udp://".self::UDP_HOST , self::UDP_PORT , $errno );
if( !$fp ) return false;
stream_set_timeout( $fp , 0 , 100 );
stream_set_blocking( $fp , 0 ); $sysinfo = posix_uname();
$msg = $version." - ".$sysinfo['nodename']." - ".date('Y-m-d H:i:s',time());
$res = fwrite( $fp , $msg );
fclose($fp);
}/*}}}*/ static public function sendRandChance($key)
{/*{{{*/
$now = microtime(true); if(function_exists("eaccelerator_get"))
{
$lastInserTime = eaccelerator_get($key);
if(!$lastInserTime) $lastInserTime = 0; if( ($now - $lastInserTime) < self::SEND_INTERVAL ) return false;
eaccelerator_put($key, $now);
return true;
}else if(function_exists("apc_fetch"))
{
$lastInserTime = apc_fetch($key);
if(!$lastInserTime) $lastInserTime = 0; if( ($now - $lastInserTime) < self::SEND_INTERVAL ) return false;
apc_store($key, $now);
return true;
} $rand = rand(1,60);
if((time()%60 == $rand) && rand(0,20) == 3)
{
return true;
}
return false;
}/*}}}*/
php多进程总结的更多相关文章
- Python中的多进程与多线程(一)
一.背景 最近在Azkaban的测试工作中,需要在测试环境下模拟线上的调度场景进行稳定性测试.故而重操python旧业,通过python编写脚本来构造类似线上的调度场景.在脚本编写过程中,碰到这样一个 ...
- 取代SharedPreferences的多进程解决方案
Android的SharedPreferences用来存储一些键值对, 但是却不支持跨进程使用. 跨进程来用的话, 当然是放在数据库更可靠啦, 本文主要是给作者的新库PreferencesProvid ...
- python 多进程使用总结
python中的多进程主要使用到 multiprocessing 这个库.这个库在使用 multiprocessing.Manager().Queue时会出问题,建议大家升级到高版本python,如2 ...
- Nginx深入详解之多进程网络模型
一.进程模型 Nginx之所以为广大码农喜爱,除了其高性能外,还有其优雅的系统架构.与Memcached的经典多线程模型相比,Nginx是经典的多进程模型.Nginx启动后以daemon ...
- Python的多线程(threading)与多进程(multiprocessing )
进程:程序的一次执行(程序载入内存,系统分配资源运行).每个进程有自己的内存空间,数据栈等,进程之间可以进行通讯,但是不能共享信息. 线程:所有的线程运行在同一个进程中,共享相同的运行环境.每个独立的 ...
- 进击的Python【第十章】:Python的socket高级应用(多进程,协程与异步)
Python的socket高级应用(多进程,协程与异步)
- PHP的pcntl多进程
PHP使用PCNTL系列的函数也能做到多进程处理一个事务.比如我需要从数据库中获取80w条的数据,再做一系列后续的处理,这个时候,用单进程?你可以等到明年今天了...所以应该使用pcntl函数了. 假 ...
- 初探PHP多进程
h2:first-child, body>h1:first-child, body>h1:first-child+h2, body>h3:first-child, body>h ...
- gdb进程调试,多进程调试
1.单进程的调试 常规的通过gdb cmd这种方式开启调试,特别说明的是通过attach的方法附加到一个指定的进程上去进行调试,这种方法适合于调试一个已经运行的进程,具体用法: gdb -p [pi ...
- python高级之多进程
python高级之多进程 本节内容 多进程概念 Process类 进程间通讯 进程同步 进程池 1.多进程概念 multiprocessing is a package that supports s ...
随机推荐
- C# DESC加密
DESC加密方法 直接上代码: 1.加密 /// <summary> /// 加密 /// </summary> /// <param name="obj&qu ...
- C库函数使用与总结之时间函数
1. localtime(取得当地目前时间和日期) [头文件]#include <time.h> [函数原型]struct tm *localtime(const time_t * tim ...
- java http工具类和HttpUrlConnection上传文件分析
利用java中的HttpUrlConnection上传文件,我们其实只要知道Http协议上传文件的标准格式.那么就可以用任何一门语言来模拟浏览器上传文件.下面有几篇文章从http协议入手介绍了java ...
- windows系统命令总结
windows系统命令总结 IIS管理器:inetmgr SQL server数据库管理器:ssms windows服务:services.msc
- [WPF系列]-ListBox
引言 本文就WPF中的ListBox常用项给以实例代码演示,包括隐蔽属性的设置,Style设置,以及ControlTemplate的自定义. Listbox平滑滚动 <ListBox Ite ...
- 观察者模式(Observer和Observable实现)
package com.wzy.java8.thread; import java.util.Observable; import java.util.Observer; public class D ...
- HTML和xhtml,CSS
索引: 初学者入门书籍 高级进阶书籍 W3C官方手册 网站架构 移动平台网站开发 视频资源 开发工具 初学者入门书籍: 中文电子书 深入浅出html pdf中文版 魅丽的网页设计 JAVA WE ...
- Learning Roadmap of Robotic Operating System (ROS)
ROS Wiki: http://wiki.ros.org/ Robots Using ROS Textbooks: A Gentle Introduction to ROS Learning ROS ...
- [转有改动]vi
转自http://www.51testing.com/html/86/427686-247344.html 多按几次[ESC],系统会发出滴滴声以确定进入命令模式.就进入了命令模式,所有在键盘上打的字 ...
- 用C#实现封装
用C#实现封装 1.属性对外公开类似于类的接口实现对字段的访问;2.字段为private只能在内部被直接访问,如果当属性为只读,那么可以将形参直接对字段赋值.(有没有更好的方法?);3.可以通过关键字 ...