遇到这种情况,首先看一下慢日志

[17-Aug-2015 13:13:43] WARNING: [pool www] child 27780, script '/data/s.com/index.php' (request: "GET /index.php") executing too slow (5.226952 sec), logging
[17-Aug-2015 13:13:43] NOTICE: child 27780 stopped for tracing
[17-Aug-2015 13:13:43] NOTICE: about to trace 27780
[17-Aug-2015 13:13:43] ERROR: failed to ptrace(PEEKDATA) pid 27780: Input/output error (5)
[17-Aug-2015 13:13:43] NOTICE: finished trace of 27780
[17-Aug-2015 13:14:16] WARNING: [pool www] child 28262, script '/data/s.com/index.php' (request: "GET /index.php/Admin/Login") executing too slow (5.205117 sec), logging
[17-Aug-2015 13:14:16] NOTICE: child 28262 stopped for tracing
[17-Aug-2015 13:14:16] NOTICE: about to trace 28262
[17-Aug-2015 13:14:16] ERROR: failed to ptrace(PEEKDATA) pid 28262: Input/output error (5)
[17-Aug-2015 13:14:16] NOTICE: finished trace of 28262
[17-Aug-2015 13:15:16] WARNING: [pool www] child 27802, script '/data/s.com/ss/connect.php' (request: "GET /ss/connect.php") executing too slow (5.579121 sec), logging
[17-Aug-2015 13:15:16] NOTICE: child 27802 stopped for tracing
[17-Aug-2015 13:15:16] NOTICE: about to trace 27802
[17-Aug-2015 13:15:16] ERROR: failed to ptrace(PEEKDATA) pid 27802: Input/output error (5)
[17-Aug-2015 13:15:16] NOTICE: finished trace of 27802
[17-Aug-2015 13:16:11] WARNING: [pool www] child 27803, script '/data/s.com/ss/url_api.inc.php' (request: "POST /ss/url_api.inc.php") executing too slow (5.130357 sec), logging
[17-Aug-2015 13:16:11] NOTICE: child 27803 stopped for tracing
[17-Aug-2015 13:16:11] NOTICE: about to trace 27803
[17-Aug-2015 13:16:11] NOTICE: finished trace of 27803

究竟为何会有这么多错误,部分PHP程序的执行时间超过了Nginx的等待时间

那么我们先看一下php-fpm的配置文件php-fpm.conf

include=/etc/php-fpm.d/*.conf
;;;;;;;;;;;;;;;;;;
; Global Options ;
;;;;;;;;;;;;;;;;;; [global]
pid = /var/run/php-fpm/php-fpm.pid
;pid设置,默认在安装目录中的var/run/php-fpm.pid,建议开启 error_log = /data/logs/error/php-fpm.error.log
;错误日志,默认在安装目录中的/data/logs/error/php-fpm.error.log log_level = error
;错误级别. 可用级别为: alert(必须立即处理), error(错误情况),
;warning(警告情况), notice(一般重要信息), debug(调试信息). 默认: notice. emergency_restart_threshold = 10
emergency_restart_interval = 1m
;表示在emergency_restart_interval所设值内出现SIGSEGV或者SIGBUS错误的php-cgi进程数如果超过
;emergency_restart_threshold个,php-fpm就会优雅重启。这两个选项一般保持默认值。 process_control_timeout = 10s
;设置子进程接受主进程复用信号的超时时间. 可用单位: s(秒), m(分), h(小时), 或者 d(天) 默认单位: s(秒). 默认值: 0 daemonize = yes
;后台执行fpm,默认值为yes,如果为了调试可以改为no。在FPM中,可以使用不同的设置来运行多个进程池。 这些设置可以针对每个进程池单独设置 ;listen.backlog = -1
;backlog数,-1表示无限制,由操作系统决定,此行注释掉就行 ;listen.allowed_clients = 127.0.0.1
;允许访问FastCGI进程的IP,设置any为不限制IP,如果要设置其他主机的nginx也能访问这台FPM进程,listen处要设置成本地可被访问的IP。
;默认值是any。每个地址是用逗号分隔. 如果没有设置或者为空,则允许任何服务器请求连接
;;;;;;;;;;;;;;;;;;;;
; Pool Definitions ;
;;;;;;;;;;;;;;;;;;;; ; See /etc/php-fpm.d/*.conf

看一下具体pool的配置文件

; Start a new pool named 'www'
[www] listen = /dev/shm/php-fpm.socket
;listen = 127.0.0.1:9000
;php-fpm 监听端口,即nginx中php处理的地址,一般默认值即可
;可用格式为: 'ip:port', 'port', '/dev/shm/php-fpm.socket',每个进程池都需要设置
;此处是放在内存中,更高效 listen.owner = www
listen.group = webgrp
listen.mode = 0666
;unix socket设置选项,如果使用tcp方式访问,这里注释即可 user = www
group = webgrp
;启动进程的帐户和组 pm = static
;对于专用服务器,pm可以设置为static
;选项有static和dynamic
;如果选择static,则由pm.max_children指定固定的子进程数
;如果选择dynamic,则由其余三个参数决定 pm.max_children = 16
;子进程最大数 pm.start_servers = 8
;启动时的进程数 pm.min_spare_servers = 5
;保证空闲进程数最小值,如果空闲进程小于此值,则创建新的子进程 pm.max_spare_servers = 25
;保证空闲进程数最大值,如果空闲进程大于此值,此进行清理 pm.max_requests = 10240
;设置每个子进程重生之前服务的请求数. 对于可能存在内存泄漏的第三方模块来说是非常有用的
;如果设置为 0 则一直接受请求. 等同于 PHP_FCGI_MAX_REQUESTS 环境变量. 默认值: 0 ;pm.status_path = /status
;php-fpm状态页面的网址. 如果没有设置, 则无法访问状态页面. 默认值: none. munin监控会使用到 ;ping.path = /ping
;php-fpm监控页面的ping网址. 如果没有设置, 则无法访问ping页面, 该页面用于外部检测php-fpm是否存活并且可以响应请求,请注意必须以斜线开头 (/)。 ;ping.response = pong
;用于定义ping请求的返回相应, 返回为 HTTP 200 的 text/plain 格式文本. 默认值: pong request_terminate_timeout = 600s
;设置单个请求的超时中止时,. 该选项可能会对php.ini设置中的'max_execution_time'因为某些特殊原因没有中止运行的脚本有用
;设置为0表示 Off,当经常出现502错误时可以尝试更改此选项 request_slowlog_timeout = 5s
;当一个请求该设置的超时时间后,就会将对应的PHP调用堆栈信息完整写入到慢日志中. 设置为 0 表示 Off
slowlog = /data/logs/error/www-slow.log
;慢请求的记录日志,配合request_slowlog_timeout使用 rlimit_files = 65535
;设置文件打开描述符的rlimit限制. 默认值: 系统定义值默认可打开句柄是1024,可使用 ulimit -n查看,ulimit -n 2048修改
rlimit_core = 0
;设置核心rlimit最大限制值. 可用值: 'unlimited' 、0或者正整数. 默认值: 系统定义值. catch_workers_output = yes
;重定向运行过程中的stdout和stderr到主要的错误日志文件中. 如果没有设置, stdout 和 stderr 将会根据FastCGI的规则被重定向到 /dev/null . 默认值: 空.
;security.limit_extensions = .php .php3 .php4 .php5 ;env[HOSTNAME] = $HOSTNAME
;env[PATH] = /usr/local/bin:/usr/bin:/bin
;env[TMP] = /tmp
;env[TMPDIR] = /tmp
;env[TEMP] = /tmp ;php_admin_value[sendmail_path] = /usr/sbin/sendmail -t -i -f www@my.domain.com
;php_flag[display_errors] = on
php_admin_value[error_log] = /var/log/php-fpm/www-error.log
php_admin_flag[log_errors] = on
;php_admin_value[memory_limit] = 32M

那么我们看一下502错误的罪魁祸首

1、php执行时间长,导致进程不够用

1)、request_terminate_timeout的值如果设置为0或者过长的时间,可能会引起file_get_contents,fsockopen的资源问题,如果file_get_contents请求的远程资源如果反应过慢,file_get_contents就会一直卡在那里不会超时

php.ini 里面max_execution_time 可以设置 PHP 脚本的最大执行时间,但是,在php-cgi(php-fpm) 中,该参数不会起效。真正能够控制 PHP 脚本最大执行时间的是 php-fpm.conf 配置文件中的request_terminate_timeout参数

参数优先级 nginx >  php-fpm > php

request_terminate_timeout 默认值为 0 秒,也就是说,PHP 脚本会一直执行下去。当所有的 php-fpm 进程都卡在 file_get_contents() 函数时,这台 Nginx+PHP 的 WebServer 已经无法再处理新的 PHP 请求了,Nginx 将给用户返回502 Bad Gateway。修改该参数,设置一个 PHP 脚本最大执行时间是必要的;但是,治标不治本,例如改成 30s,如果发生 file_get_contents() 获取网页内容较慢的情况,这就意味着 150 个 php-fpm 进程,每秒钟只能处理 5 个请求,WebServer 同样很难避免”502 Bad Gateway”。

解决办法是增大php-fpm数量,增大request_terminate_timeout,设置为300s或者一个合理的值,或者给file_get_contents加一个超时参数

2、php-fpm进程死掉,max_requests参数配置不当,可能会引起间歇性502错误

设置每个子进程重生之前服务的请求数. 对于可能存在内存泄漏的第三方模块来说是非常有用的,如果设置为 ‘0’ 则一直接受请求. 等同于 PHP_FCGI_MAX_REQUESTS 环境变量. 默认值: 0,这段配置的意思是,当一个 PHP-CGI 进程处理的请求数累积到 一定数量个后,自动重启该进程

但是为什么要重启进程呢?


般在项目中,我们多多少少都会用到一些 PHP 的第三方库,这些第三方库经常存在内存泄漏问题,如果不定期重启 PHP-CGI
进程,势必造成内存使用量不断增长。因此 PHP-FPM 作为 PHP-CGI 的管理器,提供了这么一项监控功能,对请求达到指定次数的
PHP-CGI 进程进行重启,保证内存使用量不增长

正是因为这个机制,在高并发的站点中,经常导致 502 错误,我猜测原因是 PHP-FPM 对从 NGINX 过来的请求队列没处理好

解决方法是,把这个值尽量设置大些,尽可能减少 PHP-CGI 重新 SPAWN 的次数,同时也能提高总体性能。在我们自己实际的生产环境中发现,内存泄漏并不明显,因此我们将这个值设置得非常大(204800)

这套机制目的只为保证 PHP-CGI 不过分地占用内存,为何不通过检测内存的方式来处理呢?通过设置进程的峰值内在占用量来重启 PHP-fpm进程,会是更好的一个解决方案

3、引起的错误

NOTICE] child 19214 stopped for tracing
[NOTICE] about to trace 19214
[ERROR] ptrace(PEEKDATA) failed: Input/output error (5)
[NOTICE] finished trace of 19214
[WARNING] [pool www] child 19208, script 'blahblah.php' executing too slow (30.041419 sec), logging
[NOTICE] child 19208 stopped for tracing
[NOTICE] about to trace 19208
[ERROR] ptrace(PEEKDATA) failed: Input/output error (5)
[NOTICE] finished trace of 19208
[WARNING] [pool www] child 19218, script 'blahblah.php' executing too slow (30.035029 sec), logging

解决方法

It appears you have request_slowlog_timeout enabled. This normally takes any request longer than N seconds, logs that it was taking a long time, then logs a stack trace of the script so you can see what it was doing that was taking so long.

In your case, the stack trace (to determine what the script is doing) is failing. If you're running out of processes, it is because either:

After php-fpm stops the process to trace it, the process fails to resume because of the error tracing it
The process is resuming but continues to run forever. My first guess would be to disable request_slowlog_timeout. Since it's not working right, it may be doing more harm than good. If this doesn't fix the issue of running out of processes, then set the php.ini max_execution_time to something that will kill the script for sure

4、504错误,可以进行如下修改

fastcgi_connect_timeout      180;
fastcgi_read_timeout 600;
fastcgi_send_timeout 600;

5、总结参数可以如下设置

#php.ini
max_execution_time = 300
#php-fpm.conf
request_terminate_timeout = 300
#nginx
location ~ \.php$ {
include /etc/nginx/fastcgi_params;
fastcgi_pass unix:/var/run/php5-fpm.sock;
fastcgi_read_timeout 300;
}

可以调整以上参数为500

php-fpm 进程数不够用、php执行时间长、或者是php-fpm进程死掉,都会出现502错误

参见文章如下

http://www.cnblogs.com/argb/p/3604340.html
http://yangjunwei.com/a/725.html
http://www.pooy.net/nginx-open-php-fpm-error-log.html
http://serverfault.com/questions/406532/i-o-error-with-php5-fpm-ptracepeekdata-failed
http://ju.outofmemory.cn/entry/102988

nginx中的502错误的更多相关文章

  1. nginx中配置404错误页面的教程

    什么是404页面如果网站出了问题,或者用户试图访问一个并不存在的页面时,此时服务器会返回代码为404的错误信息,此时对应页面就是404页面.404页面的默认内容和具体的服务器有关.如果后台用的是NGI ...

  2. Nginx中常见问题与错误处理

    1.400 bad request错误的原因和解决办法 配置nginx.conf相关设置如下. client_header_buffer_size 16k;large_client_header_bu ...

  3. CI 在nginx中出现404错误的解决方式

    因为你的nginx配置的是截取.php文件后缀的访问转发到PHP-CGI,而index.php和index.php/是不一样的.. 你在nginx里面写一句: if (!-e $request_fil ...

  4. NGINX 502错误排查(转)

    一.NGINX 502错误排查 NGINX 502 Bad Gateway错误是FastCGI有问题,造成NGINX 502错误的可能性比较多.将网上找到的一些和502 Bad Gateway错误有关 ...

  5. Nginx中502和504错误详解

    在使用Nginx时,经常会碰到502 Bad Gateway和504 Gateway Time-out错误,下面以Nginx+PHP-FPM来分析下这两种常见错误的原因和解决方案. 1.502 Bad ...

  6. Nginx 502错误触发条件与解决办法汇总(转载)

    一些运行在Nginx上的网站有时候会出现“502 Bad Gateway”错误,有些时候甚至频繁的出现.有些站长是在刚刚转移到Nginx之后就出现了这个问题,所以经常会怀疑这是不是Nginx的问题,但 ...

  7. Nginx常见502错误

    1.配置错误因为nginx找不到php-fpm了,所以报错,一般是fastcgi_pass后面的路径配置错误了,后面可以是socket或者是ip:port2.资源耗尽lnmp架构在处理php时,ngi ...

  8. Nginx使用ngx_zeromq模块返回502错误的解决方法

    /*********************************************************************  * Author  : Samson  * Date   ...

  9. nginx 502错误

    一些运行在Nginx上的网站有时候会出现“502 Bad Gateway”错误,有些时候甚至频繁的出现.以下是小编搜集整理的一些Nginx 502错误的排查方法,供参考: Nginx 502错误的原因 ...

随机推荐

  1. [cocos2dx笔记003] Vs2013添加静态库project

    (基于2.2.2版本号.用vs2013编辑代码)(cppblog版本号:http://www.cppblog.com/zdhsoft/archive/2014/05/11/206890.html) 在 ...

  2. 解决sqlite删除数据或者表后,文件大小不变的问题

    原因分析: sqlite采用的是变长纪录存储,当你从Sqlite删除数据后,未使用的磁盘空间被添加到一个内在的"空闲列表"中用于存储你下次插入的数据,用于提高效率,磁盘空间并没有丢 ...

  3. libcurl使用easy模式阻塞卡死等问题的完美解决---超时设置

    libcurl使用时疑难问题: 在使用libcurl时, jwisp发现, curl_easy_perform是阻塞的方式进行下载的, curl_easy_perform执行后,程序会在这里阻塞等待下 ...

  4. libjson 编译和使用 - 2. 配置使用lib文件

    以下转自:http://blog.csdn.net/laogong5i0/article/details/8223448 1. 在之前的libjson所在的解决方案里新建一个控制台应用程序,叫Test ...

  5. ScaleIO与XtremSW Cache如何集成呢?

    在ScaleIO上, XtremSW Cache主要有两种部署方式: 把XtremSW Cache在每台server的内部用作cache - 在ScaleIO Data Server(SDS)下做ca ...

  6. ASP.NET MVC中使用jQuery时的浏览器缓存问题

    介绍 尽管jQuery在浏览器ajax调用的时候对缓存提供了很好的支持,还是有必要了解一下如何高效地使用http协议. 首先要做的事情是在服务器端支持HTTP GET,定义不同的URL输出不同的数据( ...

  7. CSS中英文字符两端对齐实现

    两端对齐实现 一般加上下面2行就可实现 display: inline-block; text-align: justify; 但是对于中英文混杂的情况,中英文难一起实现对齐,原因在下面有分析,需要如 ...

  8. .NET MVC自定义错误处理页面的方法

    在ASP.NET MVC中,我们可以使用HandleErrorAttribute特性来具体指定如何处理Action抛出的异常.只要某个Action设置了HandleErrorAttribute特性,那 ...

  9. [Functional Programming] mapReduce over Async operations and fanout results in Pair(rejected, resolved) (fanout, flip, mapReduce)

    This post is similar to previous post. The difference is in this post, we are going to see how to ha ...

  10. [Javascript] Wrap an API with a Proxy

    Proxies allow you to use functions that haven't yet been defined on an object. This means that you c ...