1 同步与异步

同步和异步关注的是程序在执行时的状态:

  • 同步,可以理解为在执行完一个函数或方法之后,一直等待系统返回值或消息,这时程序是出于阻塞的,只有接收到返回的值或消息后才往下执行其他的命令。
  • 异步,执行完函数或方法后,不必阻塞性地等待返回值或消息,只需要向系统委托一个异步过程,那么当系统接收到返回值或消息时,系统会自动触发委托的异步过程,从而完成一个完整的流程。

例如:

  • 同步如打电话,通信双方不能断(我们是同时进行,同步),你一句我一句,这样的好处是,对方想表达的信息我马上能收到,但是,我在打着电话,我无法做别的事情。
  • 异步如收发收短信,对比打电话,打电话我一定要在电话的旁边听着,保证双方都在线,而收发短信,对方不用保证此刻我一定在手机旁,同时,我也不用时刻留意手机有没有来短信。这样的话,我看着视频,然后来了短信,我就处理短信(也可以不处理),接着再看视频。

        对于写程序,同步往往会阻塞,没有数据过来,我就等着,异步则不会阻塞,没数据来我干别的事,有数据来去处理这些数据。一句话总结一下就是:函数或方法被调用时,调用者是否得到最终结果的

  • 直接得到最终结果的就是同步调用;
  • 得到中间结果而非最终结果的,就是异步调用

2 阻塞与非阻塞

阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.

  • 阻塞调用是指调用结果返回之前,当前线程会被挂起。调用线程只有在得到结果之后才会返回。
  • 非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程。

一句话总结一下就是:函数或方法被调用时,是否立刻返回

  • 立即返回就是非阻塞调用
  • 不立即返回就是阻塞调用

3 什么是IO

linux系统中,所有的设备读写都可以看做文件的读写来操作,对文件的读写一般要经过内核态和用户态的切换,正因为有切换才导致了IO有同步和异步的说法。

3.1 内核态用户态

在i386之前,CPU工作在实模式下,之后开始支持保护模式,通常用保护环(ring)来描述特权级,分为四个运行级别:Ring0 ~ Ring3.

实模下,软件可以直接访问BIOS例程以及周边硬件,没有任何硬件等级的存储器保护观念或多任务。

CPU 在某个时刻运行在特定的特权级,等级约束了CPU了可以做什么,不可以做什么。x86(现在最流行的PC/Server CPU架构) CPU 只用了两个特权级:0 和 3:

  • Ring 0: 可以执行特权指令,可以访问说有级别数据,可以访问IO设备等(级别最高)
  • Ring 3:只能访问本级别数据(级别最低)

针对于Linux来说,

  • ring0 就是内核态,运行内核代码
  • ring3 就是用户态,运行用户代码

当用户的应用程序想访问某些硬件资源时,就需要通过操作系统提供的 系统调用 ,系统调用可以使用特权指令运行在内核空间,此时进程陷入内核态运行。系统调用完成,进程将回到用户态继续执行用户空间代码。

现代操作系统采用虚拟存储器,对于32位操作系统来说,进程对虚拟内存地址的内存寻址空间为4G(2^32)。操作系统中,内核程序独立且运行在较高的特权级别上,它们驻留在被保护的内存空间上,拥有访问硬件设备的权限,这部分内存称为内核空间(内核态,最高1G)。

3.2 IO两个阶段

通常来讲IO可以分成两种类型:

  • 来自网络的IO
  • 来自文件或者设备的IO

IO过程可以分为两个阶段:

  • 数据准备阶段(内核从IO设备读写数据)
  • 内核空间复制回用户空间进程缓冲区阶段(进程从内核复制数据)

3.3 IO模型

主要分为同步IO和异步IO,而同步IO又可以分为:同步阻塞IO、同步非阻塞IO、IO多路复用。

3.3.1 同步阻塞IO

进程等待(阻塞),直到读写完成。(全程等待)

3.3.2 同步非阻塞IO

进程调用read操作,如果IO设备没准备好,立即返回ERROR,进程不阻塞。用户可以再次发起系统调用,如果内核已经准备好,就阻塞,然后复制数据到用户空间

  1. 第一阶段数据没有准备好,就先忙别的,等会再来看看。检查数据是否准备好了的过程是非阻塞的。
  2. 第二阶段是阻塞的,即内核空间和用户空间之间复制数据是阻塞的。

3.3.3 IO多路复用

所谓IO多路复用,就是同时监控多个IO,有一个准备好了,就不需要等了立即开始处理,提高了同时处理IO的能力。主要的IO多路复用有:

  • select: 几乎所有操作系统平台都支持,poll是对select的升级
  • epoll:Linux系统内核2.5+开始支持,对select和poll的增强,在监视的基础上,增加回调机制。(BSD、Mac平台有kqueue,Windows有iocp)

例如:

  • select:食堂供应很多菜(众多IO),你需要吃某三菜一汤,大师傅(操作系统)说要现做,需要等。你只好等待大师傅叫,其中一样菜好了,大师傅叫你,说你点的菜有的好了,你得自己遍历找找看哪一样好了。请服务员打给你。
  • epool:是有菜准备好了,大师傅喊你去几号窗口直接打菜,不用自己找菜了。

一般情况下,select最多能监听1024个fd(可以修改,但不建议),但是由于select采用轮询的方式,当管理的IO多了,每次都要遍历全部fd,效率低下。epoll没有管理的fd的上限,且是回调机制,不需要遍历,效果很高。

3.3.4 异步IO

进程发起异步IO请求,立即返回。内核完成IO的两个阶段,后给进程发信号

Linux的aio的系统调用,内核从2.6版本开始支持。

4 Python中的IO多路复用

Python的select库实现了select、poll系统调用,这个基本上操作系统都支持,部分实现了epoll,它是底层的IO多路复用模块。

  • select维护一个文件描述符数据结构,单个进程使用于上限,通常是1024,线性扫描这个数据结构,效率低。
  • pool和select的区别是内部数据结构使用链表,没有这个最大限制,但是依然是线性遍历才知道哪个设备就绪了。
  • epoll使用事件通知机制,使用回调机制提高效率

select/pool 还有从内核空间复制消息到用户空间,而epoll通过内核空间和用户空间共享一块内存来减少复制。

4.1 selectors库

Python 3.4 提供 selectors库,高级IO复用库。它的类层次结构如下

BaseSelector
+-- SelectSelector
+-- PollSelector
+-- EpollSelector
+-- DevpollSelector
+-- KqueueSelector

观察模块原码倒数几行我们知道,selecors.DefaultSelector会返回当前平台最有效、性能最高的实现,但是由于没有实现 Windows下的IOCP,所以windows下只能退化为select。

4.2 register方法

selectorsobj.register为当前selectors实例注册一个文件对象,监视它的IO实现,返回一个selectKey对象。它的参数如下:

register(self, fileobj, events, data=None):
  • fileobj: 被监视的文件对象,比如socket对象
  • events: 事件,该文件对象必须等待的事件
  • data:可选的与此文件对象关联的不透明的属性,例如:关联用来存储每个客户端的会话ID,关联方法。通过这个参数在关注的事件产生后让selector干什么事。

常用的Event事件

  • EVENT_READ: 可读0b01,内核已经准备好输入输出设备,可以开始读了。
  • EVENT_WRITE: 可写0b10,内核准备好了,可以往里写了。

返回的selectKey对象对象具有以下方法:

  • fileobj: 注册的文件对象(socket)
  • fd:文件描述符
  • events:等待fd标识的文件对象触发的事件类型
  • data:注册时关联的数据(标识回调函数)

4.3 利用selectors完成IO多路复用版本的EchoServer

下面是代码:

import socket
import selectors
import logging
import threading
import time FORMAT = '%(asctime)s %(message)s'
logging.basicConfig(level=logging.INFO, format=FORMAT) class EchoServer: def __init__(self, ip, port):
self.ip = ip
self.port = port
self.sock = socket.socket()
self.selector = selectors.DefaultSelector()
self.evnet = threading.Event() def start(self):
self.sock.bind((self.ip, self.port))
self.sock.listen()
self.sock.setblocking(False) # 事件被触发,说明有链接进来,那么不需要阻塞等待
self.selector.register(self.sock, selectors.EVENT_READ, data=self.accept) # 注册accept函数
threading.Thread(target=self.select, name='select', daemon=True).start() # 启动监视进程 # 启动selector,用于监视事件的发生
def select(self):
while not self.evnet.is_set():
events = self.selector.select()
for key, event in events:
key.data(key.fileobj) def accept(self, sock: socket.socket):
sock, client = sock.accept()
# 将client的读写也加入到监事列表中
self.selector.register(sock, selectors.EVENT_READ, self.recv) # 当对应的socket有写操作,会直接直接触发执行,所以这里根本不需要死循环
def recv(self, sock: socket.socket):
client_ip = sock.getpeername()
data = sock.recv(1024)
if data == b'quit' or data == b'':
self.evnet.set()
sock.close()
return
msg = '{}:{} {}'.format(*client_ip, data.decode()).encode()
sock.send(msg) # 关闭进程时,将selectors中注册的事件取消掉,再关闭监视器
def stop(self):
self.evnet.set()
event_list = set()
for event in self.selector.get_map():
event_list.add(event)
for event in event_list:
self.selector.unregister(event)
self.selector.close() if __name__ == '__main__':
es = EchoServer('127.0.0.1', 9999)
es.start() while True:
cmd = input('>>>:').strip()
if cmd == 'quit':
es.stop()
break

4.4 聊天室

这里是每次client进来时,通过记录client的socket来完成的。

import socket
import selectors
import logging
import threading FORMAT = '%(asctime)s %(message)s'
logging.basicConfig(level=logging.INFO, format=FORMAT) class ChatSocketServer: def __init__(self, ip, port):
self.ip = ip
self.port = port
self.sock = socket.socket()
self.selector = selectors.DefaultSelector()
self.event = threading.Event()
self.clients = {} # 用于记录连接的client def start(self):
self.sock.bind((self.ip, self.port))
self.sock.listen()
self.sock.setblocking(False) # 事件被触发,说明有链接进来,那么不需要阻塞等待
self.selector.register(self.sock, selectors.EVENT_READ, data=self.accept) # 注册accept函数
threading.Thread(target=self.select, name='select', daemon=True).start() # 启动监视进程 # 启动selector,用于监视事件的发生
def select(self):
while not self.event.is_set():
events = self.selector.select()
for key, event in events:
key.data(key.fileobj) def accept(self, sock: socket.socket):
sock, client = sock.accept() # 添加已连接客户端列表
self.clients[client] = sock # 将client的读写也加入到监事列表中
self.selector.register(sock, selectors.EVENT_READ, self.recv) # 当对应的socket有写操作,会直接直接触发执行,所以这里根本不需要死循环
def recv(self, sock: socket.socket):
client_ip = sock.getpeername()
data = sock.recv(1024)
if data == b'quit' or data == b'':
self.clients.pop(client_ip) # 退出后弹出client地址
self.event.set()
sock.close()
return
msg = '{}:{} {}'.format(*client_ip, data.decode())
logging.info(msg)
for clients in self.clients.values():
clients.send(msg.encode()) # 关闭进程时,将selectors中注册的事件取消掉,再关闭监视器
def stop(self):
self.event.set()
event_list = set()
for event in self.selector.get_map():
event_list.add(event)
for event in event_list:
self.selector.unregister(event)
for client in self.clients.values(): # 关闭所以已连接的client的socket
client.close()
self.selector.close() if __name__ == '__main__':
es = ChatSocketServer('127.0.0.1', 9999)
es.start() while True:
cmd = input('>>>:').strip()
if cmd == 'quit':
es.stop()
break

当然还可以通过selector来处理,为什么呢?因为每当有请求进来,selector都会监视当前连接的recv,那么我们只需要在selector中的recv拿出来,就知道到底有多少连接了。

import socket
import selectors
import logging
import threading FORMAT = '%(asctime)s %(message)s'
logging.basicConfig(level=logging.INFO, format=FORMAT) class ChatSocketServer: def __init__(self, ip, port):
self.ip = ip
self.port = port
self.sock = socket.socket()
self.selector = selectors.DefaultSelector()
self.event = threading.Event() def start(self):
self.sock.bind((self.ip, self.port))
self.sock.listen()
self.sock.setblocking(False) # 事件被触发,说明有链接进来,那么不需要阻塞等待
self.selector.register(self.sock, selectors.EVENT_READ, data=self.accept) # 注册accept函数
threading.Thread(target=self.select, name='select', daemon=True).start() # 启动监视进程 # 启动selector,用于监视事件的发生
def select(self):
while not self.event.is_set():
events = self.selector.select()
for key, event in events:
key.data(key.fileobj) def accept(self, sock: socket.socket):
sock, client = sock.accept() # 将client的读写也加入到监事列表中
self.selector.register(sock, selectors.EVENT_READ, self.recv) # 当对应的socket有写操作,会直接直接触发执行,所以这里根本不需要死循环
def recv(self, sock: socket.socket):
client_ip = sock.getpeername()
data = sock.recv(1024)
if data == b'quit' or data == b'':
self.selector.unregister(sock) # 客户端退出,则取消监控当前 socket 事件
sock.close()
return
msg = '{}:{} {}'.format(*client_ip, data.decode())
logging.info(msg) # 群发消息,如果data绑定的是recv(排除accept),那么就通过socket群发消息
for sock in self.selector.get_map().values():
if sock.data == self.recv:
sock.fileobj.send(msg.encode()) # 关闭进程时,将selectors中注册的事件取消掉,再关闭监视器
def stop(self):
self.event.set()
event_list = set()
for event in self.selector.get_map():
event_list.add(event)
for event in event_list:
self.selector.unregister(event)
self.selector.close() if __name__ == '__main__':
es = ChatSocketServer('127.0.0.1', 9999)
es.start() while True:
cmd = input('>>>:').strip()
if cmd == 'quit':
es.stop()
break

39 - 同步-异步-IO多路复用的更多相关文章

  1. 事件驱动模型和异步IO多路复用

    事件驱动模型 协程:遇到IO操作就切换. 但什么时候切回去呢?怎么确定IO操作完了? 很多程序员可能会考虑使用“线程池”或“连接池”.“线程池”旨在减少创建和销毁线程的频率,其维持一定合理数量的线程, ...

  2. python开发IO模型:阻塞&非阻塞&异步IO&多路复用&selectors

    一 IO模型介绍 为了更好地了解IO模型,我们需要事先回顾下:同步.异步.阻塞.非阻塞 同步(synchronous) IO和异步(asynchronous) IO,阻塞(blocking) IO和非 ...

  3. 谈谈对不同I/O模型的理解 (阻塞/非阻塞IO,同步/异步IO)

    一.关于I/O模型的问题 最近通过对ucore操作系统的学习,让我打开了操作系统内核这一黑盒子,与之前所学知识结合起来,解答了长久以来困扰我的关于I/O的一些问题. 1. 为什么redis能以单工作线 ...

  4. 同步异步IO,阻塞非阻塞

    同步异步 同步IO操作:导致请求进程阻塞,知道IO操作完成. 异步IO操作:不导致进程阻塞. 在处理(网络) IO 的时候,阻塞和非阻塞都是同步IO, 阻塞,就是调用我(函数),我(函数)没有接收完数 ...

  5. 理解同步,异步,阻塞,非阻塞,多路复用,事件驱动IO

    以下是IO的一个基本过程 先理解一下用户空间和内核空间,系统为了保护内核数据,会将寻址空间分为用户空间和内核空间,32位机器为例,高1G字节作为内核空间,低3G字节作为用户空间.当用户程序读取数据的时 ...

  6. 自定义异步IO框架

    异步就是回调 异步 = 非阻塞+循环 select只能完成IO多路复用,不能完成异步 IO多路复用--->监听多个socket对象,这个过程是同步的 利用其特性可以开发异步模块 异步IO:非阻塞 ...

  7. Linux 网络编程的5种IO模型:异步IO模型

    Linux 网络编程的5种IO模型:异步IO模型 资料已经整理好,但是还有未竟之业:复习多路复用epoll 阅读例程, 异步IO 函数实现 背景 上一讲< Linux 网络编程的5种IO模型:信 ...

  8. node中异步IO的理解

    解释性语言和编译型语言的区别: 计算器不能直接的理解高级语言,只能理解机器语言,所以必须把高级语言翻译为机器语言,翻译的方式有两种,一个是编译,一个是解释. 解释性语言的程序不需要编译,它是在运行程序 ...

  9. IO多路复用,同步,异步,阻塞和非阻塞 区别

    一.什么是socket?什么是I/O操作? 我们都知道unix(like)世界里,一切皆文件,而文件是什么呢?文件就是一串二进制流而已,不管socket,还是FIFO.管道.终端,对我们来说,一切都是 ...

随机推荐

  1. QString,string,char* 在utf8和gbk不同编码下的相互转化

    关于编码简介:ascii编码是最开始的编码规则本,里面只收纳了英文.特殊字符.数字等有限字符,采用的是8位一个字节的方式进行编码对照:unicode在ascii码的基础上进行了升级扩展,立志将全世界所 ...

  2. idea的protobuf使用

    1.安装插件 2.添加依赖 <?xml version="1.0" encoding="UTF-8"?> <project xmlns=&qu ...

  3. div布局小技巧

    第一: 多个div整齐排列在外层div中,如图: 看到所有小的div的前后左右间隔都相等.假定已经制作好上述单元div控件.在外层大div中循环开始创建它们. for (var i=0; i < ...

  4. 51nod 1353 树 | 树形DP经典题!

    51nod 1353 树 | 树形DP好题! 题面 切断一棵树的任意条边,这棵树会变成一棵森林. 现要求森林中每棵树的节点个数不小于k,求有多少种切法. 数据范围:\(n \le 2000\). 题解 ...

  5. MVP, MVVM In Android

    MVP, MVVM In Android(新手必看)安卓MVP的理解,看完你就会用mvp了 - zq019的博客 - 博客频道 - CSDN.NEThttp://blog.csdn.net/zq019 ...

  6. bzoj3839【Pa2013】Działka

    题目描述 平面上有n个不重复的点.每次询问一个边平行坐标轴的矩形内(包含边界)的点组成的凸包的面积.. 输入格式 第一行两个整数k,n(1<=k<=1000000,3<=n<= ...

  7. linux中awk工具的使用

    awk是一个非常好用的数据处理工具.相较于sed常常一整行处理,awk则比较倾向于一行当中分成数个“字段”处理,awk处理方式如下: $ awk '条件类型1{动作1} 条件类型2{动作2} ...' ...

  8. Package ‘RSNNS’

    0 引言 Stuttgart Neural Network Simulator(SNNS)是德国斯图加特大学开发的优秀神经网络仿真软件,为国外的神经网络研究者所广泛采用.斯图加特神经网络模拟器(SNN ...

  9. Docker入门与应用系列(二)镜像管理

    1.1 什么是镜像 简单说,Docker镜像是一个不包含Linux内核而又精简的Linux操作系统. 1.2 镜像从哪里来 Docker Hub是由Docker公司负责维护的公共注册中心,包含大量的容 ...

  10. Nginx+Tomcat+Memcache实现负载均衡及Session共享

    第一部分 环境介绍 部署环境: Host1:Nginx.Memcached.Tomcat1 Host2:Tomcat2 Tomcat_version:8.0.38 第二部分 Nginx+Tomcat实 ...