select,epool,pool解释

内容主要来自搜狗实验室技术交流文档,

编写链接数巨大的高负载服务器程序时,经典的多线程模式和select模式都不再适合了.应该采用epool/kqueue/dev_pool来捕获IO事件.

------

问题的由来:

C10K问题的最大特点就是:设计不够良好的程序,其性能和链接数以及机器性能的关系是非线性的.

例子:没有考虑过C10k问题,一个经典的基于select的程序能在就服务器上很耗处理1000并发的吞吐量,但是在2倍性能新服务器上往往处理不了并发2000的吞吐量.

因为:大量操作的消耗和当前链接数n成线性相关.

=-==================

基本策略:

主要有两个方面的策略:

1,应用软件以何种方式和操作系统合作,获取IO事件并调度多个socket上的IO操作;

2,应用软件以何种方式处理任务和线程/进程的关系.

前者主要有阻塞IO,费阻塞IO,异步IO三种方式

后者主要有每任务1进程,每任务1线程,单线程,多任务共享线程池以及一些更复杂的变种方案.

常用的经典策略如下:

1,serve one client with each thread/process, and use blocking IO.,

2,serve many clients with single thread, and use nonblocking IO and readiness notification.

3,serve many clients with each thread, and use nonblocking IO and readliness notification

4,serve many clienets witch each thread, and use asynchronous IO.

接下俩主要介绍策略2.

=======================

经典的单线程服务器程序结构往往如下:

do{

    get readiness notification of all sockets

    dispatch ready handles to corresponding handlers

    if(readable){

        read the socketsif

        if(read done){

            handler process the request

        }

    }

    if(writable){

        write response

    }

    if(nothing to do){

        close socket

    }

}while(True)

其中关键的部分就是readiness notification,找出哪一个socket上面发生了IO事件.

一般从教科书和例子程序中会学到select来实现,

select函数的定义:

int select(int n,fd_set *rd_fds,fd_set *wr_fds, fd_set *ex_fds,struct timeval *timeout);

select用到了fd_set结构,从man page里可以看到fd_set能容纳的句柄和FD_SETSIZE相关.实际上fd_set在*nix下是一个bit标志数组,每个bit表示对应下标的fd是不是在fd_set中. fd_set只能容纳编号小于FD_SETSIZE的那些句柄.

----

FD_SETSIZE默认是1024,如果向fd_set中放入过大的句柄,数组越界以后程序就会垮掉.系统默认限制了一个进程最大的句柄号小于 1024,但是可以通过ulimit -n命令或者setrlimit函数来扩大这一限制.如果不幸一个程序在FD_SETSIZE=1024的环境下编译,运行时又遇到ulimit --n>1014的,会出现未定义错误.

-----

针对fd_set的问题,*nix提供了poll函数作为select的一个替代品,

int poll(struct poollfd *ufds, unsigned int nfds ,int timeout);

第一个参数ufds是用户提供的一个pollfd数组,数组大小由用户自行决定.因此避免了FD_SETSIZE带来的麻烦.

ufds是fd_set的一个完全替代品,从select到poll的一直很方便,到此我们面对C10k,可以写出一个能work的程序了.

------

但是select/poll在链接数增加时,性能急剧下降.

因为:

1,os面对每次的select/poll操作,都需要重新建立一个当前线程的关心事件列表,并把线程挂到这个复杂的等待队列上,耗时.

2,app在select/poll返回后,也需要堆传入的句柄列表做一次扫描来dispatch,耗时.

这两件事,都是和并发数相关,而事件IO的密度也和并发数相关,导致cpu占用率和并发数近似成O(n²)的关系.

-----------epoll出厂了.

因为以上原因,*nix的开发者开发了epoll,kqueue,/dev/poll这3套利器来帮助大家,

epoll是linux的方案,kqueue是freebsd方案,/dev/poll是最古老的solaris方案,使用难度一次递增.

为什么这些api是优化方案:

1,避免了每次调用select/poll时kernel分析参数建立事件等待结构的开销,kernel维护一个长期的事件关注列表,

应用程序通过句柄修改这个列表和捕获IO事件

2,避免了select/poll返回后,app扫描整个句柄表的开销,kernel直接返回具体的事件列表为app.

---先了解

边缘触发(edge trigger):指每当状态变化时发生一个IO事件

和条件触发(level trigger):只要满足条件就发生一个IO事件

举个例子:读socket,假设进过长时间沉默后,来了100个字节,这是无论边缘触发/条件触发都会产生一个read ready notification通知应用程序可读. app先读了50bytes,重新调用api等待io,这时条件触发的api因为还有50bytes刻度可立即返回用户一个read ready notification. 而边缘触发的api因为这个可读状态没变陷入长期等待.

使用边缘触发的api时,注意每次要读到socket返回EWOULDBLOCK为止,否则这个socket就废了.

而条件触发的api,如果app不需要写就不要关注socket可写的事件,否则会无限次的立即返回一个write ready notification.

条件触发比较常用.

int epoll_create(int size);

int epool_ctl(int epfd,int op,int fd, struct epoll_event *event);

int epool_wait(int epfd,struct epoll_event *events, int maxevents,int timeout);

epoll_create 创建kernel中的关注事件表,相当于创建fd_set

epoll_ctl 修改这个表,相当于FD_SET等操作

epoll_wait 等待IO事件发生,相当于select/poll函数

epoll完全是select/poll的升级版,支持的事件一致.并且epoll同时支持条件/边缘触发(后者较好).

struct epoll_event ev,*events;

int kdpdf = epoll_create();

ev.events = EPOOL|EPOLLET;//edge trigger

ev.data.fd = listener;

epoll_ctl(kdpfd,EPOLL_CTL_ADD,listener,&ev);

for(;;){

    nfds = epoll_wait(kdpfd,events,maxevents,-);

    for(n = ;n<nfds;n++){

        if(events[n].data.fd == listener){

            client = accept(listener,(struct sockaddr *)&local,&addrlen);

            if(client <){

                perror("accept");

                continue;

            }

            setnonblocking(client);

            ev.events = EPOOLIN|EPOOLET;

            ev.data.fd = client;

            if(epoll_ctl(kdpfd,EPOLL_CTL_ADD,client,&ev)<){

                fprintf(stderr,"epoll set insertion error: fd=%d0",client)

                return -;

            }

        }else{

            do_use_fd(events[n].data.fd);

        }

    }

}

select,epool,pool解释的更多相关文章

socket阻塞与非阻塞，同步与异步，select，pool，epool
概念理解一.与I/O相关的五个重要概念 1. 第一个概念:用户空间与内核空间 1. 现在操作系统都是采用虚拟存储器,那么对32位操作系统而言,它的寻址空间(虚拟存储空间)为4G(2的32次方) 2. ...
事件驱动模型 IO多路复用阻塞IO与非阻塞IO select epool
一.事件驱动 1.要理解事件驱动和程序,就需要与非事件驱动的程序进行比较.实际上,现代的程序大多是事件驱动的,比如多线程的程序,肯定是事件驱动的.早期则存在许多非事件驱动的程序,这样的程序,在需要等待 ...
selectDOM操作详解-select option详细解释
首先从一个面试题来讲,我最近在做前端面试题,题目如下: 完成函数showlmg(),要求能够动态根据下拉列表的选项变化,更新图片的显示<body><script type=" ...
网络编程socket 结合IO多路复用select; epool机制分别实现单线程并发TCP服务器
select版-TCP服务器 1. select 原理在多路复用的模型中,比较常用的有select模型和epoll模型.这两个都是系统接口,由操作系统提供.当然,Python的select模块进行了 ...
关于select那点事
select: 通过监视多个文件描述符的数组.当select()返回后文件描述符便会被内核修改标志位,使进程能进行后续操作 ------------------------------------ ...
MySQL中EXPLAIN的解释
EXPLAIN是查看MySQL优化器如何决定执行查询的主要方法,这个功能具有局限性,以为它并总是会说出真相,但是却可以获得最好信息. 学会解释EXPLAIN,你就会了解MySQL优化器是如何工作,你才 ...
python select模块详解
要理解select.select模块其实主要就是要理解它的参数, 以及其三个返回值.select()方法接收并监控3个通信列表, 第一个是所有的输入的data,就是指外部发过来的数据,第2个是监控和接 ...
UNIX网络编程——select函数的并发限制和 poll 函数应用举例
一.用select实现的并发服务器,能达到的并发数,受两方面限制 1.一个进程能打开的最大文件描述符限制.这可以通过调整内核参数.可以通过ulimit -n来调整或者使用setrlimit函数设置, ...
python select.select模块通信全过程详解
要理解select.select模块其实主要就是要理解它的参数, 以及其三个返回值.select()方法接收并监控3个通信列表, 第一个是所有的输入的data,就是指外部发过来的数据,第2个是监控和接 ...

随机推荐

Asp.net内置对象之Request对象(概述及应用)
Request对象主要用于获取来自客户端的数据,如用户填入表单的数据.保存在客户端的Cookie等,本文将围绕Request对象,讲解其的主要作用:读取窗体变量.读取查询字符串变量.取得Web服务器端 ...
poj 3468 线段树区间更新/查询
Description You have N integers, A1, A2, ... , AN. You need to deal with two kinds of operations. On ...
web标准的可用性和可访问性
在Web前端开发界,有三个词经常被提及:可用性(Usability).可访问性(Accessibility)和可维护性(Maintainability). 可用性指的是:产品是否容易上手,用户能否完成 ...
Linux安全攻防笔记
一.上传木马的过程 1.默认端口22弱口令暴力破解: 2.21端口或者3306端口弱口令暴力破解: 3.webshell进行shell反弹提权: 4.木马传入服务器的上面并且执行,通过木马的方式来控制 ...
console下纯字符实现的俄罗斯方块
忙里偷闲,消遣一下,先上一张寒酸的效果图: 废话不多说,直接上代码,win7 64 code blocks编译通过. 吐槽一下cb的watch功能实在不够友好,不过免费的也不能要求太高. [按键说明] ...
重学OpenGL（一）----工具篇
最近想开发一个小工具,需要用到3D,果断上OpenGL,借这个过程把OpenGL重学一遍. 工欲善其事,必先利其器,先把工具都搞好. [开发语言] 果断C+OpenGL,不解释. [开发环境] Min ...
配置Apache将自己的电脑做服务器使局域网内的电脑访问自己的主机
很多的朋友都想把自己的电脑打造为服务器使别人能够访问.比如说你自己写了一网站,只能自己通过localhost访问或127.0.0.1访问.但是怎么让别人的电脑也能访问呢?来看看自己写的网站.现在我来讲 ...
Scrum 项目3.0
Scrum 项目3.0 3.0----------------------------------------------------- SCRUM 流程的步骤2: Spring 计划 1. 确保pr ...
[原创]cocos2d-x研习录-第一阶背景介绍之 cocos2d家族史
Cocos2D是一个2D开源游戏引擎,它最早是由Ricardo Quesada(阿根廷人,社区简称Riq)和他的朋友们用Python开发的,用于开发2D游戏和基于2D图形的任何应用.最早引擎的名字源自 ...
as3 中 textfiled的htmltext 的常用属性
http://blog.sina.com.cn/s/blog_6d193c030100x6ud.html <a> 超链接标签属性:href: 链接地址 target: 目标窗口可取值为 ...

select,epool,pool解释

select,epool,pool解释的更多相关文章

随机推荐

热门专题