本文所剖析的tornado源码版本为4.4.2

ioloop是tornado的关键,是他的最底层。

ioloop就是对I/O多路复用的封装,它实现了一个单例,将这个单例保存在IOLoop._instance中

ioloop实现了Reactor模型,将所有要处理的I/O事件注册到一个中心I/O多路复用器上,同时主线程/进程阻塞在多路复用器上;一旦有I/O事件到来或是准备就绪(文件描述符或socket可读、写),多路复用器返回并将事先注册的相应I/O事件分发到对应的处理器中。

另外,ioloop还被用来集中运行回调函数以及集中处理定时任务。

一 准备知识:

  1 首先我们要了解Reactor模型

  2 其次,我们要了解I/O多路复用,由于本文假设系统为Linux,所以要了解epoll以及Python中的select模块

  3 IOLoop类是Configurable类的子类,而Configurable类是一个工厂类,讲解在这

二  创建IOLoop实例

来看IOLoop,它的父类是Configurable类,也就是说:IOLoop是一个直属配置子类

  1. class IOLoop(Configurable):
  2. ......

这里就要结合Configurable类进行讲解:

  1. def __new__(cls, *args, **kwargs)
  2. '''
  3. 解析出impl对象
  4. 1 cls是直属配置子类时,impl就是该直属配置子类的'执行类对象'
  5. 2 cls是从属配置子类时,impl就是该从属配置子类自身
  6. 然后实例化一个impl实例对象
  7. 运行其initialize方法,并传入合并后的参数
  8. 返回该impl实例对象
  9. '''
  10. base = cls.configurable_base()
  11. init_kwargs = {}
  12. if cls is base:
  13. impl = cls.configured_class()
  14. if base.__impl_kwargs:
  15. init_kwargs.update(base.__impl_kwargs)
  16. else:
  17. impl = cls
  18. init_kwargs.update(kwargs)
  19. instance = super(Configurable, cls).__new__(impl)
  20. instance.initialize(*args, **init_kwargs)
  21. return instance

Configurable中的__new__方法

1 首先实例化一个该直属配置子类的'执行类对象',也就是调用该类的configurable_default方法并返回赋值给impl:

  1. @classmethod
  2. def configurable_default(cls):
  3. if hasattr(select, "epoll"): # 因为我们假设我们的系统为Linux,且支持epoll,所以这里为True
  4. from tornado.platform.epoll import EPollIOLoop
  5. return EPollIOLoop
  6. if hasattr(select, "kqueue"):
  7. # Python 2.6+ on BSD or Mac
  8. from tornado.platform.kqueue import KQueueIOLoop
  9. return KQueueIOLoop
  10. from tornado.platform.select import SelectIOLoop
  11. return SelectIOLoop

2 也就是impl是EPollIOLoop类对象,然后实例化该对象,运行其initialize方法

  1. class EPollIOLoop(PollIOLoop):  # 该类只有这么短短的几句,可见主要的方法是在其父类PollIOLoop中实现。
  2. def initialize(self, **kwargs):
  3. super(EPollIOLoop, self).initialize(impl=select.epoll(), **kwargs) # 执行了父类PollIOLoop的initialize方法,并将select.epoll()传入

  来看一看PollIOLoop.initialize(EPollIOLoop(),impl=select.epoll())干了些啥:

  1. class PollIOLoop(IOLoop): # 从属配置子类
  2.  
  3. def initialize(self, impl, time_func=None, **kwargs):
  4. super(PollIOLoop, self).initialize(**kwargs) # 调用IOLoop的initialize方法
  5. self._impl = impl # self._impl = select.epoll()
  6. if hasattr(self._impl, 'fileno'): # 文件描述符的close_on_exec属性
  7. set_close_exec(self._impl.fileno())
  8. self.time_func = time_func or time.time
  9. self._handlers = {} # 文件描述符对应的fileno()作为key,(文件描述符对象,处理函数)作为value
  10. self._events = {} # 用来存储epoll_obj.poll()返回的事件,也就是哪个fd发生了什么事件{(fd1, event1), (fd2, event2)……}
  11. self._callbacks = []
  12. self._callback_lock = threading.Lock() # 添加线程锁
  13. self._timeouts = [] # 存储定时任务
  14. self._cancellations = 0
  15. self._running = False
  16. self._stopped = False
  17. self._closing = False
  18. self._thread_ident = None # 获得当前线程标识符
  19. self._blocking_signal_threshold = None
  20. self._timeout_counter = itertools.count()
  21.  
  22. # Create a pipe that we send bogus data to when we want to wake
  23. # the I/O loop when it is idle
  24. self._waker = Waker()
  25. self.add_handler(self._waker.fileno(),
  26. lambda fd, events: self._waker.consume(),
  27. self.READ)

  首先调用了IOLoop.initialize(self,**kwargs)方法:

  1. def initialize(self, make_current=None):
  2. if make_current is None:
  3. if IOLoop.current(instance=False) is None:
  4. self.make_current()
  5. elif make_current:
  6. if IOLoop.current(instance=False) is not None:
  7. raise RuntimeError("current IOLoop already exists")
  8. self.make_current()
  9. @staticmethod
  10. def current(instance=True):
  11. current = getattr(IOLoop._current, "instance", None)
  12. if current is None and instance:
  13. return IOLoop.instance()
  14. return current
  15.  
  16. def make_current(self):
  17. IOLoop._current.instance = self

我们可以看到IOLoop.initialize()主要是对线程做了一些支持和操作。

3 返回该实例

三 剖析PollIOLoop

1 处理I/O事件以及其对应handler的相关属性以及方法

使用self._handlers用来存储fd与handler的对应关系,文件描述符对应的fileno()作为key,元组(文件描述符对象,处理函数)作为value

  self._events 用来存储epoll_obj.poll()返回的事件,也就是哪个fd发生了什么事件{(fd1, event1), (fd2, event2)……}

add_handler方法用来添加handler

  update_handle方法用来更新handler

remove_handler方法用来移除handler

  1. def add_handler(self, fd, handler, events):
  2. # 向epoll中注册事件 , 并在self._handlers[fd]中为该文件描述符添加相应处理函数
  3. fd, obj = self.split_fd(fd) # fd.fileno(),fd
  4. self._handlers[fd] = (obj, stack_context.wrap(handler))
  5. self._impl.register(fd, events | self.ERROR)
  6.  
  7. def update_handler(self, fd, events):
  8. fd, obj = self.split_fd(fd)
  9. self._impl.modify(fd, events | self.ERROR)
  10.  
  11. def remove_handler(self, fd):
  12. fd, obj = self.split_fd(fd)
  13. self._handlers.pop(fd, None)
  14. self._events.pop(fd, None)
  15. try:
  16. self._impl.unregister(fd)
  17. except Exception:
  18. gen_log.debug("Error deleting fd from IOLoop", exc_info=True)

2 处理回调函数的相关属性以及方法

  self._callbacks用来存储回调函数

  add_callback方法用来直接添加回调函数

  add_future方法用来间接的添加回调函数,future对象详解在这

  1. def add_callback(self, callback, *args, **kwargs):
  2. # 因为Python的GIL的限制,导致Python线程并不算高效。加上tornado实现了多进程 + 协程的模式,所以我们略过源码中的部分线程相关的一些操作
  3. if self._closing:
  4. return
  5. self._callbacks.append(functools.partial(stack_context.wrap(callback), *args, **kwargs))
  6. def add_future(self, future, callback):
  7. # 为future对象添加经过包装后的回调函数,该回调函数会在future对象被set_done后添加至_callbacks中
  8. assert is_future(future)
  9. callback = stack_context.wrap(callback)
  10. future.add_done_callback(
  11. lambda future: self.add_callback(callback, future))

3 处理定时任务的相关属性以及方法

  self._timeouts用来存储定时任务

  self.add_timeout用来添加定时任务(self.call_later   self.call_at都是间接调用了该方法)

  1. def add_timeout(self, deadline, callback, *args, **kwargs):
  2. """
  3. ``deadline``可能是一个数字,表示相对于当前时间的时间(与“IOLoop.time”通常为“time.time”相同的大小),或者是datetime.timedelta对象。
  4. 自从Tornado 4.0以来,`call_later`是一个比较方便的替代方案,因为它不需要timedelta对象。
  5.  
  6. """
  7. if isinstance(deadline, numbers.Real):
  8. return self.call_at(deadline, callback, *args, **kwargs)
  9. elif isinstance(deadline, datetime.timedelta):
  10. return self.call_at(self.time() + timedelta_to_seconds(deadline),
  11. callback, *args, **kwargs)
  12. else:
  13. raise TypeError("Unsupported deadline %r" % deadline)

4 启动io多路复用器

  启动也一般就意味着开始循环,那么循环什么呢?

    1 运行回调函数

    2 运行时间已到的定时任务

    3 当某个文件描述法发生事件时,运行该事件对应的handler

  使用start方法启动ioloop,看一下其简化版(去除线程相关,以及一些相对不重要的细节):

  1. def start(self):
  2. try:
  3. while True:
  4. callbacks = self._callbacks
  5. self._callbacks = []
  6. due_timeouts = []
  7. # 将时间已到的定时任务放置到due_timeouts中,过程省略
  8. for callback in callbacks: # 执行callback
  9. self._run_callback(callback)
  10. for timeout in due_timeouts: # 执行定时任务
  11. if timeout.callback is not None:
  12. self._run_callback(timeout.callback)
  13. callbacks = callback = due_timeouts = timeout = None # 释放内存
  14. # 根据情况设置poll_timeout的值,过程省略
  15. if not self._running: # 终止ioloop运行时,在执行完了callback后结束循环
  16. break
    try:
  17. event_pairs = self._impl.poll(poll_timeout)
  18. except Exception as e:
  19. if errno_from_exception(e) == errno.EINTR: # 系统调用被信号处理函数中断,进行下一次循环
  20. continue
  21. else:
  22. raise
  23. self._events.update(event_pairs)
  24. while self._events:
  25. fd, events = self._events.popitem() # 获取一个fd以及对应事件
  26. try:
  27. fd_obj, handler_func = self._handlers[fd] # 获取该fd对应的事件处理函数
  28. handler_func(fd_obj, events) # 运行该事件处理函数
  29. except (OSError, IOError) as e:
  30. if errno_from_exception(e) == errno.EPIPE: # 当客户端关闭连接时会产生EPIPE错误
  31. pass
  32. # 其他异常处理已经省略
  33. fd_obj = handler_func = None # 释放内存空间
  1. def start(self):
  2. if self._running:
  3. raise RuntimeError("IOLoop is already running")
  4. self._setup_logging()
  5. if self._stopped:
  6. self._stopped = False
  7. return
  8. old_current = getattr(IOLoop._current, "instance", None)
  9. IOLoop._current.instance = self
  10. self._thread_ident = thread.get_ident() # 获得当前线程标识符
  11. self._running = True
  12. old_wakeup_fd = None
  13. if hasattr(signal, 'set_wakeup_fd') and os.name == 'posix':
  14. # 需要Python2.6及以上版本,类UNIX系统,set_wake_up_fd存在。在windows系统上运行会崩溃
  15. try:
  16. old_wakeup_fd = signal.set_wakeup_fd(self._waker.write_fileno())
  17. if old_wakeup_fd != -1:
  18. # Already set, restore previous value. This is a little racy,
  19. # but there's no clean get_wakeup_fd and in real use the
  20. # IOLoop is just started once at the beginning.
  21. signal.set_wakeup_fd(old_wakeup_fd)
  22. old_wakeup_fd = None
  23. except ValueError:
  24. # Non-main thread, or the previous value of wakeup_fd
  25. # is no longer valid.
  26. old_wakeup_fd = None
  27.  
  28. try:
  29. while True:
  30. # 防止多线程模型时产生脏数据
  31. with self._callback_lock:
  32. callbacks = self._callbacks
  33. self._callbacks = []
  34.  
  35. due_timeouts = []
  36. if self._timeouts: # 将时间已到的定时任务放置到due_timeouts中
  37. now = self.time()
  38. while self._timeouts:
  39. if self._timeouts[0].callback is None:
  40. heapq.heappop(self._timeouts)
  41. self._cancellations -= 1
  42. elif self._timeouts[0].deadline <= now:
  43. due_timeouts.append(heapq.heappop(self._timeouts))
  44. else:
  45. break
  46. if (self._cancellations > 512 and
  47. self._cancellations > (len(self._timeouts) >> 1)):
  48. self._cancellations = 0
  49. self._timeouts = [x for x in self._timeouts
  50. if x.callback is not None]
  51. heapq.heapify(self._timeouts)
  52.  
  53. for callback in callbacks: # 执行callbacks
  54. self._run_callback(callback)
  55. for timeout in due_timeouts: # 执行timeout_callback
  56. if timeout.callback is not None:
  57. self._run_callback(timeout.callback)
  58. # 释放内存
  59. callbacks = callback = due_timeouts = timeout = None
  60.  
  61. if self._callbacks: # 如果在执行callbacks 或者 timeouts的过程中,他们执行了add_callbacks ,那么这时:self._callbacks就非空了,
  62. # 为了尽快的执行其中的callbacks,我们需要将poll_timeout 设置为0,这样我们就不需要等待fd事件发生,尽快运行callbacks了
  63. poll_timeout = 0.0
  64. elif self._timeouts:
  65. # If there are any timeouts, schedule the first one.
  66. # Use self.time() instead of 'now' to account for time
  67. # spent running callbacks.
  68. poll_timeout = self._timeouts[0].deadline - self.time()
  69. poll_timeout = max(0, min(poll_timeout, _POLL_TIMEOUT))
  70. else:
  71. # 如果没有回调函数也没有定时任务,我们就使用默认值
  72. poll_timeout = _POLL_TIMEOUT
  73.  
  74. if not self._running: # 终止ioloop运行时,在执行完了callback后结束循环
  75. break
  76.  
  77. if self._blocking_signal_threshold is not None:
  78. # clear alarm so it doesn't fire while poll is waiting for
  79. # events.
  80. signal.setitimer(signal.ITIMER_REAL, 0, 0)
  81.  
  82. try:
  83. event_pairs = self._impl.poll(poll_timeout)
  84. except Exception as e:
  85. # http://blog.csdn.net/benkaoya/article/details/17262053 解释EINTR是什么。系统调用被信号处理函数中断,进行下一次循环
  86. if errno_from_exception(e) == errno.EINTR:
  87. continue
  88. else:
  89. raise
  90.  
  91. if self._blocking_signal_threshold is not None:
  92. signal.setitimer(signal.ITIMER_REAL,
  93. self._blocking_signal_threshold, 0)
  94.  
  95. # 从一组待处理的fds中一次弹出一个fd并运行其处理程序。
  96. # 由于该处理程序可能会对其他文件描述符执行操作,因此可能会重新调用此IOLoop来修改self._events
  97. self._events.update(event_pairs)
  98. while self._events:
  99. fd, events = self._events.popitem() # 获取一个fd以及对应事件
  100. try:
  101. fd_obj, handler_func = self._handlers[fd] # 获取该fd对应的事件处理函数
  102. handler_func(fd_obj, events) # 运行该事件处理函数
  103. except (OSError, IOError) as e:
  104. if errno_from_exception(e) == errno.EPIPE:
  105. # 当客户端关闭连接时会产生EPIPE错误
  106. pass
  107. else:
  108. self.handle_callback_exception(self._handlers.get(fd))
  109. except Exception:
  110. self.handle_callback_exception(self._handlers.get(fd))
  111. # 释放内存空间
  112. fd_obj = handler_func = None
  113.  
  114. finally:
  115. # reset the stopped flag so another start/stop pair can be issued
  116. self._stopped = False
  117. if self._blocking_signal_threshold is not None:
  118. signal.setitimer(signal.ITIMER_REAL, 0, 0)
  119. IOLoop._current.instance = old_current
  120. if old_wakeup_fd is not None:
  121. signal.set_wakeup_fd(old_wakeup_fd)

start完整版

5 关闭io多路复用器

  1. def close(self, all_fds=False):
  2. with self._callback_lock:
  3. self._closing = True
  4. self.remove_handler(self._waker.fileno())
  5. if all_fds: # 该参数若为True,则表示会关闭所有文件描述符
  6. for fd, handler in self._handlers.values():
  7. self.close_fd(fd)
  8. self._waker.close()
  9. self._impl.close()
  10. self._callbacks = None
  11. self._timeouts = None

四 参考 

  https://zhu327.github.io/2016/06/14/tornado%E4%BB%A3%E7%A0%81%E9%98%85%E8%AF%BB%E7%AC%94%E8%AE%B0-ioloop/
  https://www.zhihu.com/question/20021164
  http://stackoverflow.com/questions/12179271/meaning-of-classmethod-and-staticmethod-for-beginner/12179752#12179752
  http://blog.csdn.net/benkaoya/article/details/17262053

深入tornado中的ioLoop的更多相关文章

  1. 在 tornado 中异步无阻塞的执行耗时任务

    在 tornado 中异步无阻塞的执行耗时任务 在 linux 上 tornado 是基于 epoll 的事件驱动框架,在网络事件上是无阻塞的.但是因为 tornado 自身是单线程的,所以如果我们在 ...

  2. tornado中使用torndb,连接数过高的问题

    问题背景 最近新的产品开发中,使用了到了Tornado和mysql数据库.但在基本框架完成之后,我在开发时候发现了一个很奇怪的现象,我在测试时,发现数据库返回不了结果,于是我在mysql中输入show ...

  3. 在tornado中使用celery实现异步任务处理之中的一个

    一.简单介绍 tornado-celery是用于Tornado web框架的非堵塞 celeryclient. 通过tornado-celery能够将耗时任务增加到任务队列中处理, 在celery中创 ...

  4. 深入tornado中的协程

    tornado使用了单进程(当然也可以多进程) + 协程 + I/O多路复用的机制,解决了C10K中因为过多的线程(进程)的上下文切换 而导致的cpu资源的浪费. tornado中的I/O多路复用前面 ...

  5. 深入tornado中的TCPServer

    1 梳理: 应用层的下一层是传输层,而http协议一般是使用tcp的,所以实现tcp的重要性就不言而喻. 由于tornado中实现了ioloop这个反应器以及iostream这个对连接的异步读写,所以 ...

  6. 深入tornado中的http1connection

    前言 tornado中http1connection文件的作用极其重要,他实现了http1.x协议. 本模块基于gen模块和iostream模块实现异步的处理请求或者响应. 阅读本文需要一些基础的ht ...

  7. 基于python3.x,使用Tornado中的torndb模块操作数据库

    目前Tornado中的torndb模块是不支持python3.x,所以需要修改部分torndb源码即可正常使用 1.开发环境介绍 操作系统:win8(64位),python版本:python3.6(3 ...

  8. Python设计模式中单例模式的实现及在Tornado中的应用

    单例模式的实现方式 将类实例绑定到类变量上 class Singleton(object): _instance = None def new(cls, *args): if not isinstan ...

  9. Python Tornado框架(ioloop对象分析)

    网上都说nginx和lighthttpd是高性能web服务器,而tornado也是著名的高抗负载应用,它们间有什么相似处呢?上节提到的ioloop对象是如何循环的呢?往下看. 首先关于TCP服务器的开 ...

随机推荐

  1. 《Django By Example》第九章 中文 翻译 (个人学习,渣翻)

    书籍出处:https://www.packtpub.com/web-development/django-example 原作者:Antonio Melé (译者@ucag 注:哈哈哈,第九章终于来啦 ...

  2. yii2 Nav::widget() 和 Menu::widget()

    Nav::widget http://www.yiiframework.com/doc-2.0/yii-bootstrap-nav.html Menu::widget()  http://www.yi ...

  3. Exchange无法发送邮件 未找到匹配的连接器来路由外部收件人解决办法

    使用命令行管理程序创建发送连接器 本示例创建发送连接器,用于集线器传输服务器 HubA 向 Internet 发送电子邮件.   复制 New-SendConnector -Name "In ...

  4. windows phone 8.1开发SQlite数据库引用安装

    原文出自:http://www.bcmeng.com/windows-phone-sqlite/ windows phone 8.1开发SQlite数据库引用安装 第一步: 安装SQlite forw ...

  5. java与xml之间的转换(jaxb)

    使用java提供的JAXB来实现java到xml之间的转换,先创建两个持久化的类(Student和Classroom): Classroom: package com.model; public cl ...

  6. (转)Linux core 文件介绍与处理

    1. core文件的简单介绍 在一个程序崩溃时,它一般会在指定目录下生成一个core文件.core文件仅仅是一个内存映象(同时加上调试信息),主要是用来调试的. 2. 开启或关闭core文件的生成用以 ...

  7. python运用中文注释时报错解决方法

    写了一段简单的代码,不知 为什么总是报错,后来上网查了一下才知道原因,当用中文进行注释时需要添加如下代码:# coding=utf-8          (注意:该段代码必须放在最前面才能有用,并且 ...

  8. zabbix 监控 tomcat jmx

    zabbix_server: zabbix_server.conf : # Add JavaGateway=127.0.0.1 JavaGatewayPort=10052 StartJavaPolle ...

  9. Ubuntu下php网站运行环境搭建

    第一步:查看是否安装lamp相关软件: dpkg -s 软件名称,比如php.mysql.apache. dpkg-query -l 软件名称 要列出你系统中安装的所有包,输入下面的命令:dpkg - ...

  10. 老李推荐:第2章2节《MonkeyRunner源码剖析》了解你的测试对象: NotePad窗口Activity之NotesList简介

    老李推荐:第2章2节<MonkeyRunner源码剖析>了解你的测试对象: NotePad窗口Activity之NotesList简介   NotePad窗口Activity之NotesL ...