在python的网络编程里,socetserver是个重要的内置模块,其在内部其实就是利用了I/O多路复用、多线程和多进程技术,实现了并发通信。与多进程和多线程相比,I/O多路复用的系统开销小,系统不必额外再创建进程或线程,也就不需要维护这些进程或线程,从而大大减小了系统的开销。当然,这三者不是孤立的,可以联合使用,效果可能更好。

IO多路复用的原理

   首先,必须说明的是IO多路复用不是python专有的概念,它是系统层面的;

  其次,所谓的多路复用只是一种如何在“人很多但是路只有一条”的情况下快速通行的方法,类似于通信中的“时分复用”;

  最后,在谈及网络编程的IO多路复用时,我们一般是针对socket而言的。

  在类似大型网站高并发的环境中,同时进行的socket通信数量及其庞大,每一个socket通信链路就是一个IO流,而主机的IO吞吐能力又是有限的,为了尽量的提高处理效率,先后开发出了select,poll,epoll三种IO多路复用的机制。他们可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作。其本质上都是同步I/O,因为他们都需要在读写事件就绪后自己负责进行读写,也就是说这个读写过程是阻塞的。

  1983 BSD里面实现了select机制,但很快就暴露出了很多问题。

  • select 会修改传入的参数数组,这个对于一个需要调用很多次的函数,是非常不友好的;
  • select会将每一个有变化的socket加入它维护的列表中,但是并不会明确是哪一个socket。它内部其实是通过一个for循环遍历整个列表。当socket的数量不多的时候可能还好,但是几万、几十万、几千万个socket的时候,这个for循环就比较坑了;

  • select 同时只能监视1024个链接,它是由linux 在头文件中定义的,参见FD_SETSIZE,这个可以修改,问题不算大;

  • select 不是线程安全的,如果你把一个socket加入到select, 然后突然另外一个线程关闭了这个socket, 那么接下来select的行为是随机的....

  14年以后的1997年poll机制被发明, 它修复了select的很多问题:

  • poll 去掉了1024个链接的限制,想要多少就多少;
  • poll 不再修改传入数组,但是与平台有关。

  但是poll仍然不是线程安全的!

  5年以后的2002,牛人Davide Libenzi 实现了epoll机制。它修复了poll 和select的绝大部分问题, 比如:

  • epoll 是线程安全的;
  • epoll 不仅告诉你sock组里面数据,还会告诉你具体哪个socket有数据,你不用自己去找了。

  看到这里,貌似有了epoll,select之流可以退休了。但实际情况不是这样的。

  • windows暂时只支持seclet,它没有epoll....
  • select的各平台支持度比较好,API也比较通用,通俗点就是“皮实耐操通用性好舒适度差”;
  • epoll是linux内核原生支持的机制,虽然强大,但是各平台支持度不一样,API也差别较大,就是那种“高大上但局限性高”的东西。不过epoll显然是未来的大趋势。

python中的IO多路复用

  了解了IO多路复用,我们就来看看python中是如何使用的。Python中有一个select模块,其中提供了:select、poll、epoll三个方法,分别调用系统的 select,poll,epoll 从而实现IO多路复用。(下面以select方法为例)

  1. Windows Python
  2. 提供: select
  3. Mac Python
  4. 提供: select
  5. Linux Python
  6. 提供: selectpollepoll

  注意:网络操作、文件操作、终端操作等均属于IO操作,对于windows只支持Socket操作,其他系统支持其他IO操作,但是无法检测 普通文件操作 自动上次读取是否已经变化。

  对于select方法:

  1. 句柄列表11, 句柄列表22, 句柄列表33 = select.select(句柄序列1, 句柄序列2, 句柄序列3, 超时时间)
  2. 参数: 可接受四个参数(前三个必须)
  3. 返回值:三个列表
  4.  
  5. select方法用来监视文件句柄,如果句柄发生变化,则获取该句柄。
  6. 1、当 参数1 序列中的句柄发生可读时(accetpread),则获取发生变化的句柄并添加到 返回值1 序列中
  7. 2、当 参数2 序列中含有句柄时,则将该序列中所有的句柄添加到 返回值2 序列中
  8. 3、当 参数3 序列中的句柄发生错误时,则将该发生错误的句柄添加到 返回值3 序列中
  9. 4、当 超时时间 未设置,则select会一直阻塞,直到监听的句柄发生变化
  10. 超时时间 1时,那么如果监听的句柄均无任何变化,则select会阻塞 1 秒,之后返回三个空列表,如果监听的句柄有变化,则直接执行。
  1. #!/usr/bin/env python
  2. # -*- coding:utf-8 -*-
  3.  
  4. import select
  5. import threading
  6. import sys
  7.  
  8. while True:
  9. readable, writeable, error = select.select([sys.stdin,],[],[],1)
  10. if sys.stdin in readable:
  11. print( 'select get stdin',sys.stdin.readline())

利用select监听终端操作实例

利用select实现伪同时处理多个Socket客户端请求:服务端

  1. #!/usr/bin/env python
  2. # -*- coding:utf-8 -*-
  3. import socket
  4.  
  5. ip_port = ('127.0.0.1',8002)
  6. sk = socket.socket()
  7. sk.connect(ip_port)
  8.  
  9. while True:
  10. inp = input('please input:').encode()
  11. sk.sendall(inp)
  12. sk.close()

利用select实现伪同时处理多个Socket客户端请求:客户端

  此处的Socket服务端相比与原生的Socket,他支持当某一个请求不再发送数据时,服务器端不会等待而是可以去处理其他请求的数据。但是,如果每个请求的耗时比较长时,select版本的服务器端也无法完成同时操作。

  1. #!/usr/bin/env python
  2. #coding:utf8
  3.  
  4. '''
  5. 服务器的实现 采用select的方式
  6. '''
  7.  
  8. import select
  9. import socket
  10. import sys
  11. import Queue
  12.  
  13. #创建套接字并设置该套接字为非阻塞模式
  14.  
  15. server = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
  16. server.setblocking(0)
  17.  
  18. #绑定套接字
  19. server_address = ('localhost',10000)
  20.  
  21. server.bind(server_address)
  22.  
  23. #将该socket变成服务模式
  24. #backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5
  25. #这个值不能无限大,因为要在内核中维护连接队列
  26.  
  27. server.listen(5)
  28.  
  29. #初始化读取数据的监听列表,最开始时希望从server这个套接字上读取数据
  30. inputs = [server]
  31.  
  32. #初始化写入数据的监听列表,最开始并没有客户端连接进来,所以列表为空
  33.  
  34. outputs = []
  35.  
  36. #要发往客户端的数据
  37. message_queues = {}
  38. while inputs:
  39. print('waiting for the next event')
  40. #调用select监听所有监听列表中的套接字,并将准备好的套接字加入到对应的列表中
  41. readable,writable,exceptional = select.select(inputs,outputs,inputs)#列表中的socket 套接字 如果是文件呢?
  42. #监控文件句柄有某一处发生了变化 可写 可读 异常属于Linux中的网络编程
  43. #属于同步I/O操作,属于I/O复用模型的一种
  44. #rlist--等待到准备好读
  45. #wlist--等待到准备好写
  46. #xlist--等待到一种异常
  47. #处理可读取的套接字
  48.  
  49. '''
  50. 如果server这个套接字可读,则说明有新链接到来
  51. 此时在server套接字上调用accept,生成一个与客户端通讯的套接字
  52. 并将与客户端通讯的套接字加入inputs列表,下一次可以通过select检查连接是否可读
  53. 然后在发往客户端的缓冲中加入一项,键名为:与客户端通讯的套接字,键值为空队列
  54. select系统调用是用来让我们的程序监视多个文件句柄(file descrīptor)的状态变化的。程序会停在select这里等待,
  55. 直到被监视的文件句柄有某一个或多个发生了状态改变
  56. '''
  57.  
  58. '''
  59. 若可读的套接字不是server套接字,有两种情况:一种是有数据到来,另一种是链接断开
  60. 如果有数据到来,先接收数据,然后将收到的数据填入往客户端的缓存区中的对应位置,最后
  61. 将于客户端通讯的套接字加入到写数据的监听列表:
  62. 如果套接字可读.但没有接收到数据,则说明客户端已经断开。这时需要关闭与客户端连接的套接字
  63. 进行资源清理
  64. '''
  65.  
  66. for s in readable:
  67. if s is server:
  68. connection,client_address = s.accept()
  69. print('connection from',client_address)
  70. connection.setblocking(0)#设置非阻塞
  71. inputs.append(connection)
  72. message_queues[connection] = Queue.Queue()
  73. else:
  74. data = s.recv(1024).decode()
  75. if data:
  76. print('received "%s" from %s'% \
  77. (data,s.getpeername()))
  78. message_queues[s].put(data)
  79. if s not in outputs:
  80. outputs.append(s)
  81. else:
  82. print('closing',client_address)
  83. if s in outputs:
  84. outputs.remove(s)
  85. inputs.remove(s)
  86. s.close()
  87. del message_queues[s]
  88.  
  89. #处理可写的套接字
  90. '''
  91. 在发送缓冲区中取出响应的数据,发往客户端。
  92. 如果没有数据需要写,则将套接字从发送队列中移除,select中不再监视
  93. '''
  94.  
  95. for s in writable:
  96. try:
  97. next_msg = message_queues[s].get_nowait()
  98.  
  99. except Queue.Empty:
  100. print(' ',s,getpeername(),'queue empty')
  101. outputs.remove(s)
  102. else:
  103. print('sending "%s" to %s'% \
  104. (next_msg,s.getpeername()))
  105. s.send(next_msg)
  106.  
  107. #处理异常情况
  108.  
  109. for s in exceptional:
  110. for s in exceptional:
  111. print('exception condition on',s.getpeername())
  112. inputs.remove(s)
  113. if s in outputs:
  114. outputs.remove(s)
  115. s.close()
  116. del message_queues[s]

基于select实现socket服务端

python之IO多路复用的更多相关文章

  1. {python之IO多路复用} IO模型介绍 阻塞IO(blocking IO) 非阻塞IO(non-blocking IO) 多路复用IO(IO multiplexing) 异步IO(Asynchronous I/O) IO模型比较分析 selectors模块

    python之IO多路复用 阅读目录 一 IO模型介绍 二 阻塞IO(blocking IO) 三 非阻塞IO(non-blocking IO) 四 多路复用IO(IO multiplexing) 五 ...

  2. 【python】-- IO多路复用(select、poll、epoll)介绍及实现

    IO多路复用(select.poll.epoll)介绍及select.epoll的实现 IO多路复用中包括 select.pool.epoll,这些都属于同步,还不属于异步 一.IO多路复用介绍 1. ...

  3. python中IO多路复用、协程

    一.IO多路复用 IO多路复用:检测多个socket是否已经发生变化(是否已经连接成功/是否已经获取数据)(可读/可写) import socket def get_data(key): client ...

  4. 09 Python之IO多路复用

    四种常见IO模型 阻塞IO(blocking IO).非阻塞IO(nonblocking IO).IO多路复用(IOmultiplexing).异步IO(asynchronous IO) IO发生时涉 ...

  5. Python poll IO多路复用

    一.poll介绍 poll本质上和select没有区别,只是没有了最大连接数(linux上默认1024个)的限制,原因是它基于链表存储的. 本人的另一篇博客讲了 python  select : ht ...

  6. Python select IO多路复用

    一.select介绍 Python的select()函数是底层操作系统实现的直接接口.它监视套接字,打开文件和管道(任何带有返回有效文件描述符的fileno()方法),直到它们变得可读或可写,或者发生 ...

  7. Python进程、线程、协程及IO多路复用

    详情戳击下方链接 Python之进程.线程.协程 python之IO多路复用

  8. Python(七)Socket编程、IO多路复用、SocketServer

    本章内容: Socket IO多路复用(select) SocketServer 模块(ThreadingTCPServer源码剖析) Socket socket通常也称作"套接字" ...

  9. python中的IO多路复用

    在python的网络编程里,socetserver是个重要的内置模块,其在内部其实就是利用了I/O多路复用.多线程和多进程技术,实现了并发通信.与多进程和多线程相比,I/O多路复用的系统开销小,系统不 ...

随机推荐

  1. windows 隐藏文件方法

    隐藏: 然后在里面输入:attrib +s +a +h +r f:\123 (f的意思就是F盘,123就是你新建的文件夹名字),然后按回车,你会发现F盘下的123文件夹不见的,其实就是被你隐藏了. 文 ...

  2. Openresty 安装教程

    Openresty的简单安装方法,如需高级编译安装,请参照安装选项 1.安装配置好Yum源,不赘述此步骤 2.安装必要组件 yum install pcre-devel openssl-devel g ...

  3. 源代码目录结构--AngularJS学习笔记(一)

    最近开始接触AngularJS,确实是一个相当不错的东西,可以把很多东西简化掉.又对于其中的双向绑定等的实现很好奇,加之正在学习Javascript的东西,所以觉得从源代码这块开始深入学习Angula ...

  4. icmp,tcp,traceroute,ping,iptables

    有东莞的监控主机到北京BGP出问题了: 报警短信疯狂发送: 找东莞IDC和北京BGP服务商协查: 有个奇怪的问题:北京到东莞trcaceroute都有路由信息 东莞143段到北京全无路由信息:但,东莞 ...

  5. 【转载】酷酷的CSS3三角形运用

    转载:http://www.cnblogs.com/keepfool/p/5616326.html 概述 在早期的前端Web设计开发年代,完成一些页面元素时,我们必须要有专业的PS美工爸爸,由PS美工 ...

  6. 恶心的sbt 超级慢--解决

    最近在看sbt相关的资料.发现其构建仓库是用ivy和maven 相信使用过maven的人都知道下载 jar的过程十分痛苦(因为你穷,买不起VPN) 然后我们天朝本来有开源中国的maven库,后来又突然 ...

  7. 安装python官方的mysql库“mysql-connector-python”

    $ echo https://cdn.mysql.com/Downloads/Connector-Python/mysql-connector-python-2.1.3.tar.gz >> ...

  8. MySQL、PostgreSQL、Ingres r3、MaxDB等开源数据库的详细比较

    1.MySQL 5 作为当今最流行的开放源码数据库之一,MySQL数据库为用户提供了一个相对简单的 解决方案,适用于广泛的应用程序部署,能够降低用户的TCO.MySQL是一个多线程.结构化查询语言(S ...

  9. 修改 Semantic UI 的默认字体

    Semantic UI 默认使用的是谷歌提供的字体,并且是直接使用了谷歌的官方链接.由于大家都知道的原因,谷歌网站在国内访问速度很差,甚至根本无法访问,还有就是可能会在离线环境下使用 Semantic ...

  10. sruts2:单个文件上传,多个文件上传(属性驱动)

    文件上传功能在Struts2中得到了很好的封装,主要使用fileUpload上传组件. 1. 单个文件上传 1.1 创建上传单个文件的JSP页面.显示提交结果的JSP页面 uploadTest1.js ...