应对百万访问量的epoll模式
写在前面
上一篇文章并发模型:Actors与CSP简单介绍了Actors和CSP两种并发模型。如果认真推敲会发现,无论是Actors还是CSP,直观上来说其实都是内存模型,那么高并发的CPU模型是怎么样的呢?
或者说:只有8颗CPU核的一台主机,同一时间至多运行8个线程,如何实现一秒时间内对上万个请求的响应?
select/poll与epoll
select/poll模型工作机理
在epoll之前,存在两种高并发模型:select和poll,大体的步骤是:
# select和poll模式会专门对下面的连接链表进行轮询,查看那个连接上有请求
head->connetion1->connection2->connection3->connection4->...
- 创建连接链表。简单讲,同一时间来了一万连接请求,给用户A发来的连接请求创建一个专门的connection1,用户B发来的连接请求创建一个专门的connection2;给用户C发来的……
- 遍历步骤1生成的连接链表,从connection1一个个地看直到connection10000,查看哪个连接(connection)上面用户发了新的请求,如果有发现新的请求,则想办法通知负责当前连接的进程(比如我们自己的服务)去响应,然后继续遍历。
- 终于遍历到了最后一个连接,继续从头开始遍历。
select/poll模型的局限
从上面的描述可以知道,select/poll模型里面存在一个遍历查找过程。当链表的长度较短,且每个连接(connection)上的请求很频繁时,select/poll的模型工作的很好;但是一旦连接数增加,select/poll模式遍历查找的过程会消耗大量的CPU时间,而且连接数越多情况越恶化,因此限制了这种模式在高访问量场景下的使用。
epoll模型工作机理
既然遍历连接(可以看做一小块内存,是文件描述符的一种)限制了select/poll模型的天花板,那么能不能不要再让CPU遍历那么多连接了。
linux说:可以。
# 连接的列表,每个连接存在一个唯一的id
[0]connection0 | [1]connection1 | [2]connection2 | ...
# 发现connection1和connection10有请求
# 把它们加入到一个特殊的链表
head->connection1->connection10
大体的步骤如下:
- 创建连接数组列表。同一时间来了一万连接请求,给用户A发来的连接请求创建一个专门的connection0,ID为0;用户B发来的连接请求创建一个专门的connection1,ID为1;给用户C发来的……
- linux内核和网卡驱动的约定:当某个连接上有新的请求时,网卡驱动把请求的内容和对应的连接ID一起发给内核。
- linux内核拿到了带连接ID的请求,找到对应的connectionID并把它加入到一个特殊链表。
- 遍历这个特殊的链表,想办法通知负责当前连接的进程(比如我们自己的服务)去响应,然后继续遍历
注意第4步,因为linux内核已经把存在实际请求的连接拣出来了,因此不存在徒劳功,老老实实处理请求就好了。
epoll的局限
像上面所描述的,epoll杜绝了无意义的遍历,因此在高访问量场景中有很大的发挥空间。但是不能不说,一切都是基于web请求计算量低请求低频的场景。
试想,对于epoll中的connection,如果网卡突然对linux内核说:哥,现在所有的连接都有请求。那么特殊链表里其实就是所有的连接实例了,这种场景下epoll反而不如select/poll模式,毕竟后者步骤少啊。
幸运的是,我们所说的百万访问量,都是人发起的,很契合epoll的使用场景。
golang中的epoll
参见 大专栏 应对百万访问量的epoll模式golang源码的src/runtime/proc.go
文件,其在main函数启动时,既开始在系统栈开始运行sysmon
函数。
func main() {
//...
systemstack(func() {
newm(sysmon, nil)
})
//...
}
golang源码中的sysmon函数
通过查看sysmon函数可以知道,这个函数主要的是一个无穷的for
循环,负责调整时序、GC(垃圾回收)以及epoll检查等。
// sysmon
// Go runtime启动时创建的,负责监控所有goroutine的状态判断是否需要GC,
// 进行netpoll等操作。sysmon函数中会调用retake函数进行抢占式调度
func sysmon() {
//...
for {
if netpollinited() && lastpoll != 0 && lastpoll+10*1000*1000 < now {
//更新最后一次查询G时间,为了下一次做判断
atomic.Cas64(&sched.lastpoll, uint64(lastpoll), uint64(now))
// 从网络I/O查找已经就绪的G,不阻塞
gp := netpoll(false) // non-blocking - returns list of goroutines
//...
}
}
}
进一步查看netpoll
函数,能发现主要有下面几个函数:
epollcreate/epollcreate1
创建epollepollctl
设置epoll事件epollwait
等待epoll事件
到这里,golang与epoll就算对接上了。因为时间问题,细节暂时就不展开了,大家感兴趣可以自己探索。
小结
本文简单介绍了epoll模型。直观上来讲,并发模型中的Actors模型、CSP模型等,侧重的是内存的分配与信号的管理;但是,如何能充分发挥这些并发模型的优势,满足高并发的真实场景呢?
答案就是epoll模型。相比较于传统的select/poll模型,epoll能更充分地利用cpu的时间,把性能投入到有效的运算中去。
参考
应对百万访问量的epoll模式的更多相关文章
- python 简单搭建非阻塞式单进程,select模式,epoll模式服务
由于经常被抓取文章内容,在此附上博客文章网址:,偶尔会更新某些出错的数据或文字,建议到我博客地址 : --> 点击这里 可以看我的上篇文章 <python 简单搭建阻塞式单进程,多进程, ...
- 浅谈Python-IO多路复用(select、poll、epoll模式)
1. 什么是IO多路复用 在传统socket通信中,存在两种基本的模式, 第一种是同步阻塞IO,其线程在遇到IO操作时会被挂起,直到数据从内核空间复制到用户空间才会停止,因为对CPython来说,很多 ...
- Netty socket.io 启用Epoll 模式异常
Epoll 环境为Linux 内核2.6 以上版本 Windows下不能启动 1:判断Linux环境 public static boolean isOSLinux() { Properties p ...
- [记录]Python的master-worker和epoll模式
#master-worker模型: #coding:utf-8 import os import sys import socket import time import traceback impo ...
- 【Nginx】epoll事件驱动模块
Linux 2.4之前的内核版本号,Nginx事件驱动的方法是使用poll.select功能.过程必须等待一个事件发生在连接上(接收数据)时间,部连接都告诉内核,由内核找出哪些连接上有事件发生.因为须 ...
- select epoll poll
如何理解 Epoll select 和 poll 三种模型,能否用生活中的例子做比喻? 比如说你从某宝下单买了几个东西,这几个东西分别由N个快递员分别给你送过来.在某一时刻,你开始等快递.对于sele ...
- PLG SaaS 产品 Figma 商业模式拆解
9 月 15 日,Figma 的 CEO Dylan Field 发布消息:今天,Figma 宣布接受 Adobe 的收购... Adobe 以约 200 亿美元收购 Figma,这也是 Adobe ...
- [Linux]I/O多路复用和epoll
首先我们来定义流的概念,一个流可以是文件,socket,pipe等等可以进行I/O操作的内核对象. 不管是文件,还是套接字,还是管道,我们都可以把他们看作流. 之后我们来讨论I/O的操作,通过read ...
- python网络编程——IO多路复用之epoll
1.内核EPOLL模型讲解 此部分参考http://blog.csdn.net/mango_song/article/details/42643971博文并整理 首先我们来定义流的概念,一个流 ...
随机推荐
- python计算范数的问题
计算norm时, 注意把数据改为float 类型, 否则结果不对! import numpy.linalg as LA d = LA.svd(features.toarray(),full_matri ...
- JavaWeb部分视频\2-12JSP,EL和JSTL
JavaWeb知识结构图 第3节 EL介绍和运算符 && 第4节 EL获取域中存储的数据 ## EL表达式 1. 概念:Expression Language 表达式语言 2. 作用: ...
- PAT Advanced 1038 Recover the Smallest Number (30) [贪⼼算法]
题目 Given a collection of number segments, you are supposed to recover the smallest number from them. ...
- 伯特兰·亚瑟·威廉·罗素[註 1],第三代羅素伯爵(英语:Bertrand Arthur William Russell, 3rd Earl Russell,1872年5月18日-1970年2月2日),OM,FRS,英国哲学家、数学家和逻辑学家,致力于哲学的大众化、普及化。[2] 在數學哲學上採取弗雷格的邏輯主義立場,認為數學可以化約到邏輯,哲學可以像邏輯一樣形式系統化,主張逻辑原子論。[3]
一年假. 1920年7月,罗素申請了一年假; 這被批准了.他花了一年時間在中國和日本講學.对中国学术界有相当影响. 罗素说: 对爱情的渴望,对知识的追求,对人类苦难不可遏制的同情,是支配我一生的单纯 ...
- dubbo的重试原则
验证思路.使用超时来验证重试次数 XML 注解
- Codeforces Round #530 (Div. 2)F Cookies (树形dp+线段树)
题:https://codeforces.com/contest/1099/problem/F 题意:给定一个树,每个节点有俩个信息x和t,分别表示这个节点上的饼干个数和先手吃掉这个节点上一个饼干的的 ...
- MySQL_语句
一.基础 1.说明:创建数据库CREATE DATABASE database-name 2.说明:删除数据库drop database dbname 3.说明:备份sql server--- 创建 ...
- HEX 文件格式
例 FDFFF885C3 :每行开头 第一个字节:表示本行的数据长度, 第二个,第三个字节表示本行数据的起始地址. 第四字节表示数据类型,数据类型有:0x00.0x01.0x02.0x03.0x04. ...
- C++ sizeof 运算符
sizeof 是一个关键字,它是一个编译时运算符,用于判断变量或数据类型的字节大小. sizeof 运算符可用于获取类.结构.共用体和其他用户自定义数据类型的大小. 使用 sizeof 的语法如下: ...
- range|Sample Standard Deviation|标准差几何意义
Measures of Variation 方差:measures of variation or measures of spread 源于range发现range不足以评估整个set(因为只用到l ...