【Nginx】惊群问题

惊群问题的产生

在建立连接的时候，Nginx处于充分发挥多核CPU架构性能的考虑，使用了多个worker子进程监听相同端口的设计，这样多个子进程在accept建立新连接时会有争抢，这会带来著名的“惊群”问题，子进程数量越多越明显，这会造成系统性能的下降。

一般情况下，有多少CPU核心就有配置多少个worker子进程。假设现在没有用户连入服务器，某一时刻恰好所有的子进程都休眠且等待新连接的系统调用（如 epoll_wait），这时有一个用户向服务器发起了连接，内核在收到TCP的SYN包时，会激活所有的休眠worker子进程。最终只有最先开始执行 accept的子进程可以成功建立新连接，而其他worker子进程都将accept失败。这些accept失败的子进程被内核唤醒是不必要的，他们被唤醒会的执行很可能是多余的，那么这一时刻他们占用了本不需要占用的资源，引发了不必要的进程切换，增加了系统开销。

如何解决惊群问题-post事件处理机制

很多操作系统的最新版本的内核已经在事件驱动机制中解决了惊群问题，但Nginx作为可移植性极高的web服务器，还是在自身的应用层面上较好的解决了这一问题。Nginx规定了同一时刻只有唯一一个worker子进程监听web端口，这一就不会发生惊群了，此时新连接事件只能唤醒唯一的正在监听端口的worker子进程。

如何限制在某一时刻是有一个子进程监听web端口呢？在打开accept_mutex锁的情况下，只有调用ngx_trylock_accept_mutex方法后，当前的worker进程才会去试着监听web端口。

那么，什么时候释放ngx_accept_mutex锁呢？

显然不能等到这批事件全部执行完。因为这个worker进程上可能有许多活跃的连接，处理这些连接上的事件会占用很长时间，其他worker进程很难得到处理新连接的机会。

如何解决长时间占用ngx_accept_mutex的问题呢？这就要依靠post事件处理机制，Nginx设计了两个队列：ngx_posted_accept_events队列（存放新连接事件的队列）和 ngx_posted_events队列（存放普通事件的队列）。这两个队列都是ngx_event_t类型的双链表。定义如下：

ngx_thread_volatile ngx_event_t  *ngx_posted_accept_events;

ngx_thread_volatile ngx_event_t  *ngx_posted_events;

下面结合具体代码进行分析惊群问题的解决。

首先看 worker进程中ngx_process_events_and_timers事件处理函数（src/event/ngx.event.c），它处于 worker进程的ngx_worker_process_cycle方法中，循环处理时间，是事件驱动机制的核心，既会处理普通的网络事件，也会处理定时器事件。ngx_process_events_and_timers是Nginx实际处理web业务的方法，所有业务的执行都是由它开始的，它涉及 Nginx完整的事件驱动机制！！特别重要~

void

ngx_process_events_and_timers(ngx_cycle_t *cycle)

{

    ngx_uint_t  flags;

    ngx_msec_t  timer, delta;

    if (ngx_timer_resolution) {

        timer = NGX_TIMER_INFINITE;

        flags = ;

    } else {

        timer = ngx_event_find_timer();

        flags = NGX_UPDATE_TIME;

#if (NGX_THREADS)

        if (timer == NGX_TIMER_INFINITE || timer > ) {

            timer = ;

        }

#endif

    }

    /*ngx_use_accept_mutex表示是否需要通过对accept加锁来解决惊群问题。当使用了master模式，nginx worker进程数>1时且配置文件中打开accept_mutex时，这个标志置为1

    它在函数ngx_event_process_int中被设置，源代码为：

    if (ccf->master && ccf->worker_processes > 1 && ecf->accept_mutex) {

        ngx_use_accept_mutex = 1;

        ngx_accept_mutex_held = 0;

        ngx_accept_mutex_delay = ecf->accept_mutex_delay;

    } else {

        ngx_use_accept_mutex = 0;

    }*/

    if (ngx_use_accept_mutex) {

        //负载均衡处理

        if (ngx_accept_disabled > ) {

            ngx_accept_disabled--;

        } else {

            //调用ngx_trylock_accept_mutex方法，尝试获取accept锁

            if (ngx_trylock_accept_mutex(cycle) == NGX_ERROR) {

                return;

            }

            //拿到锁

            if (ngx_accept_mutex_held) {

                /*给flags增加标记NGX_POST_EVENTS，这个标记作为处理时间核心函数ngx_process_events的一个参数，这个函数中所有事件将延后处理。会把accept事件都放到ngx_posted_accept_events链表中，epollin|epollout普通事件都放到ngx_posted_events链表中 */

                flags |= NGX_POST_EVENTS;

            } else {

                /*获取锁失败，意味着既不能让当前worker进程频繁的试图抢锁，也不能让它经过太长事件再去抢锁

                下面的代码：即使开启了timer_resolution时间精度，牙需要让ngx_process_change方法在没有新事件的时候至少等待ngx_accept_mutex_delay毫秒之后再去试图抢锁

                而没有开启时间精度时，如果最近一个定时器事件的超时时间距离现在超过了ngx_accept_mutex_delay毫秒，也要把timer设置为ngx_accept_mutex_delay毫秒，这是因为当前进程虽然没有抢到accept_mutex锁，但也不能让ngx_process_change方法在没有新事件的时候等待的时间超过ngx_accept_mutex_delay，这会影响整个负载均衡机制*/

                if (timer == NGX_TIMER_INFINITE

                    || timer > ngx_accept_mutex_delay)

                {

                    timer = ngx_accept_mutex_delay;

                }

            }

        }

    }

    //计算ngx_process_events消耗的时间

    delta = ngx_current_msec;

    //事件处理核心函数

    (void) ngx_process_events(cycle, timer, flags);

    delta = ngx_current_msec - delta;

    ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, ,

                   "timer delta: %M", delta);

    //ngx_posted_accept_events链表有数据，开始accept新连接

    if (ngx_posted_accept_events) {

        ngx_event_process_posted(cycle, &ngx_posted_accept_events);

    }

    //释放锁后再处理ngx_posted_events链表中的普通事件

    if (ngx_accept_mutex_held) {

        ngx_shmtx_unlock(&ngx_accept_mutex);

    }

    //如果ngx_process_events消耗的时间大于0，那么这是可能有新的定时器事件触发

    if (delta) {

        //处理定时器事件

        ngx_event_expire_timers();

    }

    ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, ,

                   "posted events %p", ngx_posted_events);

    //ngx_posted_events链表中有数据，进行处理

    if (ngx_posted_events) {

        if (ngx_threaded) {

            ngx_wakeup_worker_thread(cycle);

        } else {

            ngx_event_process_posted(cycle, &ngx_posted_events);

        }

    }

}

上面代码中要进行说明的是，flags被设置后作为函数ngx_process_events方法的一个参数，在epoll模块中这个接口的实现方法是ngx_epoll_process_events（其具体代码见http://blog.csdn.net/xiajun07061225/article/details/9250341）。当falgs标志位含有nGX_POST_EVENTS时是不会立即调用事件的handler回调方法的，代码如下所示：

 //事件需要延后处理

            if (flags & NGX_POST_EVENTS) {

                /*如果要在post队列中延后处理该事件，首先要判断它是新连接时间还是普通事件

                以确定是把它加入到ngx_posted_accept_events队列或者ngx_posted_events队列中。*/

                queue = (ngx_event_t **) (rev->accept ?

                               &ngx_posted_accept_events : &ngx_posted_events);

                //将该事件添加到相应的延后队列中

                ngx_locked_post_event(rev, queue);

            } else {

                //立即调用事件回调方法来处理这个事件

                rev->handler(rev);

            }

通过上面的代码可以看出，先处理ngx_posted_accept_events队列中的事件，处理完毕后立即释放ngx_accept_mutex锁，接着再处理ngx_posted_events队列中事件。这样大大减少了ngx_accept_mutex锁占用的时间

下面看看ngx_trylock_accept_mutex的具体实现（src/event/ngx_event_accept.c）：

ngx_int_t

ngx_trylock_accept_mutex(ngx_cycle_t *cycle)

{

    //尝试获取accept_mutex锁。注意是非阻塞的。返回1表示成功，返回0表示失败。

    //ngx_accept_mutex 定义：ngx_shmtx_t    ngx_accept_mutex;（ngx_shmtx_t是Nginx封装的互斥锁，用于经常间同步）

    if (ngx_shmtx_trylock(&ngx_accept_mutex)) {

        ngx_log_debug0(NGX_LOG_DEBUG_EVENT, cycle->log, ,

                       "accept mutex locked");

        //获取到锁，但是标志位ngx_accept_mutex_held为1，表示当前进程已经获取到锁了，立即返回。

        if (ngx_accept_mutex_held

            && ngx_accept_events ==

            && !(ngx_event_flags & NGX_USE_RTSIG_EVENT))

        {

            return NGX_OK;

        }

        //将所有监听事件添加到当前的epoll等事件驱动模块中

        if (ngx_enable_accept_events(cycle) == NGX_ERROR) {

            //添加失败，必须释放互斥锁

            ngx_shmtx_unlock(&ngx_accept_mutex);

            return NGX_ERROR;

        }

        //标志位设置

        ngx_accept_events = ;

        //当前进程已经获取到锁

        ngx_accept_mutex_held = ;

        return NGX_OK;

    }

    ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, ,

                   "accept mutex lock failed: %ui", ngx_accept_mutex_held);

    //获取锁失败，但是标志位ngx_accept_mutex_held仍然为1，即当前进程还处在获取到锁的状态，这是不正确的

    if (ngx_accept_mutex_held) {

        //将所有监听事件从事件驱动模块中移除

        if (ngx_disable_accept_events(cycle) == NGX_ERROR) {

            return NGX_ERROR;

        }

        //没有获取到锁，设置标志位

        ngx_accept_mutex_held = ;

    }

    return NGX_OK;

}

调用这个方法的结果是，要么唯一获取到锁且其epoll等事件驱动模块开始监控web端口上的新连接事件。这种情况下调用process_events方法时就会既处理已有连接上的事件，也处理新连接的事件。要么没有获取到锁，当前进程不会收到新连接事件。这种情况下process_events只处理已有连接上的事件。

参考：

http://russelltao.iteye.com/blog/1405352

【Nginx】惊群问题的更多相关文章

Nginx惊群问题
Nginx惊群问题 "惊群"概念所谓惊群,可以用一个简单的比喻来说明: 一群等待食物的鸽子,当饲养员扔下一粒谷物时,所有鸽子都会去争抢,但只有少数的鸽子能够抢到食物, 大部分鸽子 ...
Nginx惊群处理
惊群:是指在多线程/多进程中,当有一个客户端发生链接请求时,多线程/多进程都被唤醒,然后只仅仅有一个进程/线程处理成功,其他进程/线程还是回到睡眠状态,这种现象就是惊群. 惊群是经常发生现在serve ...
NGINX怎样处理惊群的
写在前面写NGINX系列的随笔,一来总结学到的东西,二来记录下疑惑的地方,在接下来的学习过程中去解决疑惑. 也希望同样对NGINX感兴趣的朋友能够解答我的疑惑,或者共同探讨研究. 整个NGINX系列 ...
“惊群”，看看nginx是怎么解决它的
在说nginx前,先来看看什么是“惊群”?简单说来,多线程/多进程(linux下线程进程也没多大区别)等待同一个socket事件,当这个事件发生时,这些线程/进程被同时唤醒,就是惊群.可以想见,效率很 ...
Nginx学习之一-惊群现象
惊群问题(thundering herd)的产生在建立连接的时候,Nginx处于充分发挥多核CPU架构性能的考虑,使用了多个worker子进程监听相同端口的设计,这样多个子进程在accept建立新连 ...
【转载】“惊群”，看看nginx是怎么解决它的
原文:http://blog.csdn.net/russell_tao/article/details/7204260 在说nginx前,先来看看什么是“惊群”?简单说来,多线程/多进程(linux下 ...
Nginx中的惊群现象解决方法
*什么是惊群现象?Nginx中用了什么方法来避免这种问题的发生?本篇就解决这两个问题...→_→* 惊群现象的定义与危害在Nginx中,每一个worker进程都是由master进程fork出来的.m ...
Nginx模型 & 惊群问题
这篇写的不错 http://www.cnblogs.com/linguoguo/p/5511293.html Nginx为啥性能高-多进程异步IO模型 1. 对于每个worker进程来说,独立的进程, ...
nginx&http 第三章惊群
惊群:概念就不解释了. 直接说正题:惊群问题一般出现在那些web服务器上,Linux系统有个经典的accept惊群问题,这个问题现在已经在内核曾经得以解决,具体来讲就是当有新的连接进入到accept队 ...

随机推荐

JS concat() 方法
[数组元素的合并] 一. concat() 方法 concat() 方法用于连接两个或多个数组. 返回一个新的数组.该数组是通过把所有 arrayX 参数添加到 arrayObject 中生成的.如果 ...
Python3基础教程（十六）—— 迭代器、生成器、装饰器
在这个实验里我们学习迭代器.生成器.装饰器有关知识. 这几个概念是 Python 中不容易理解透彻的概念,务必把所有的实验代码都完整的输入并理解清楚其中每一行的意思. 迭代器 Python 迭代器(I ...
socks5代理原理解析
sock5代理的工作程序是: 1.需要代理方向服务器发出请求信息. 2.代理方应答 3.需要代理方接到应答后发送向代理方发送目的ip和端口 4.代理方与 ...
magic_quotes_runtime 和 magic_quotes_sybase 的作用
如果启用了 magic_quotes_runtime,大多数返回任何形式外部数据的函数,包括数据库和文本段将会用反斜线转义引号. 如果启用了magic_quotes_sybase,单引号会被单引号转义 ...
Dart开发环境搭建
一．SDK的安装与环境配置 1. 下载Dark SDK http://www.gekorm.com/dart-windows/ 2. 安装SDK 3. 配置环境变量(一般已经默认生成好了,这里可以 ...
faster rcnn训练过程讲解
http://blog.csdn.net/u014696921/article/details/60321425
saltstack入门个人笔记
offical website reference1 reference2 install apt-get install python-software-properties apt install ...
三、C++ const分析
1.C语言中的const: const修饰的变量是只读的,本质还是变量 const修饰的局部变量在栈上分配空间 const修饰的全局变量在只读存储区分配空间 const只在编译期有用,在运行期无效 c ...
ICPC-Beijing 2006 狼抓兔子
题目描述题解: 裸的最小割. 但是最大流跑不过去怎么办? 转变一下,既然最大流是一条左下<->右上的通路,我们可以把图划分为若干区域, 最后找左下到右上的最短路就行了. 代码: #inc ...
SDOI2011 拦截导弹
题目描述题解: 对于第一问,我们求二维LIS即可; 对于第二问,我们可以记录向前最长长度,向前最长方案数,向后最长长度,向后最长方案数. 其实改改树状数组即可. 还有,方案数一定要开double. ...

【Nginx】惊群问题

【Nginx】惊群问题的更多相关文章

随机推荐

热门专题