线程池原理及python实现

为什么需要线程池
　　目前的大多数网络服务器，包括Web服务器、Email服务器以及数据库服务器等都具有一个共同点，就是单位时间内必须处理数目巨大的连接请求，但处理时间却相对较短。
　　传统多线程方案中我们采用的服务器模型则是一旦接受到请求之后，即创建一个新的线程，由该线程执行任务。任务执行完毕后，线程退出，这就是是“即时创建，
即时销毁”的策略。尽管与创建进程相比，创建线程的时间已经大大的缩短，但是如果提交给线程的任务是执行时间较短，而且执行次数极其频繁，那么服务器将处于不停的创建线程，销毁线程的状态。
　　我们将传统方案中的线程执行过程分为三个过程：T1、T2、T3：
　　T1：线程创建时间
　　T2：线程执行时间，包括线程的同步等时间
　　T3：线程销毁时间

　　那么我们可以看出，线程本身的开销所占的比例为(T1+T3) / (T1+T2+T3)。如果线程执行的时间很短的话，这比开销可能占到20%-50%左右。如果任务执行时间很频繁的话，这笔开销将是不可忽略的。
　　除此之外，线程池能够减少创建的线程个数。通常线程池所允许的并发线程是有上界的，如果同时需要并发的线程数超过上界，那么一部分线程将会等待。而传统方案中，如果同时请求数目为2000，那么最坏情况下，系统可能需要产生2000个线程。尽管这不是一个很大的数目，但是也有部分机器可能达不到这种要求。
　　因此线程池的出现正是着眼于减少线程池本身带来的开销。线程池采用预创建的技术，在应用程序启动之后，将立即创建一定数量的线程(N1)，放入空闲队列
中。这些线程都是处于阻塞（Suspended）状态，不消耗CPU，但占用较小的内存空间。当任务到来后，缓冲池选择一个空闲线程，把任务传入此线程中运行。当N1个线程都在处理任务后，缓冲池自动创建一定数量的新线程，用于处理更多的任务。在任务执行完毕后线程也不退出，而是继续保持在池中等待下一次的任务。当系统比较空闲时，大部分线程都一直处于暂停状态，线程池自动销毁一部分线程，回收系统资源。
　　基于这种预创建技术，线程池将线程创建和销毁本身所带来的开销分摊到了各个具体的任务上，执行次数越多，每个任务所分担到的线程本身开销则越小，不过我们另外可能需要考虑进去线程之间同步所带来的开销。

构建线程池框架

　　一般线程池都必须具备下面几个组成部分：
　　线程池管理器:用于创建并管理线程池
　　工作线程: 线程池中实际执行的线程
　　任务接口: 尽管线程池大多数情况下是用来支持网络服务器，但是我们将线程执行的任务抽象出来，形成任务接口，从而是的线程池与具体的任务无关。
　　任务队列:线程池的概念具体到实现则可能是队列，链表之类的数据结构，其中保存执行线程。

　　我们把任务放进队列中去，然后开N个线程，每个线程都去队列中取一个任务，执行完了之后告诉系统说我执行完了，然后接着去队列中取下一个任务，直至队列中所有任务取空，退出线程。

　　这就是一般的线程池实现的原理，下面看一个实际的代码：

　　线程池的python实现代码：

 # !/usr/bin/env python

 # -*- coding:utf-8 -*-

 import Queue

 import threading

 import time

 class WorkManager(object):

     def __init__(self, work_num=1000,thread_num=2):

         self.work_queue = Queue.Queue()

         self.threads = []

         self.__init_work_queue(work_num)

         self.__init_thread_pool(thread_num)

     """

         初始化线程

     """

     def __init_thread_pool(self,thread_num):

         for i in range(thread_num):

             self.threads.append(Work(self.work_queue))

     """

         初始化工作队列

     """

     def __init_work_queue(self, jobs_num):

         for i in range(jobs_num):

             self.add_job(do_job, i)

     """

         添加一项工作入队

     """

     def add_job(self, func, *args):

         self.work_queue.put((func, list(args)))#任务入队，Queue内部实现了同步机制

     """

         等待所有线程运行完毕

     """

     def wait_allcomplete(self):

         for item in self.threads:

             if item.isAlive():item.join()

 class Work(threading.Thread):

     def __init__(self, work_queue):

         threading.Thread.__init__(self)

         self.work_queue = work_queue

         self.start()

     def run(self):

         #死循环，从而让创建的线程在一定条件下关闭退出

         while True:

             try:

                 do, args = self.work_queue.get(block=False)#任务异步出队，Queue内部实现了同步机制

                 do(args)

                 self.work_queue.task_done()#通知系统任务完成

             except:

                 break

 #具体要做的任务

 def do_job(args):

     time.sleep(0.1)#模拟处理时间

     print threading.current_thread(), list(args)

 if __name__ == '__main__':

     start = time.time()

     work_manager =  WorkManager(10000, 10)#或者work_manager =  WorkManager(10000, 20)

     work_manager.wait_allcomplete()

     end = time.time()

     print "cost all time: %s" % (end-start)

　　Work类是一个Python线程池，不断地从workQueue队列中获取需要执行的任务，执行之，并将结果写入到resultQueue中。这里的workQueue和resultQueue都是线程安全的，其内部对各个线程的操作做了互斥。当从workQueue中获取任务超时，则线程结束。

　　WorkerManager负责初始化Python线程池，提供将任务加入队列和获取结果的接口，并能等待所有任务完成。

　　在 Python 中使用线程时，这个模式是一种很常见的并且推荐使用的方式。具体工作步骤描述如下：

创建一个 Queue.Queue() 的实例，然后使用数据对它进行填充。
将经过填充数据的实例传递给线程类，后者是通过继承 threading.Thread 的方式创建的。
生成守护线程池。
每次从队列中取出一个项目，并使用该线程中的数据和 run 方法以执行相应的工作。
在完成这项工作之后，使用 queue.task_done() 函数向任务已经完成的队列发送一个信号。
对队列执行 join 操作，实际上意味着等到队列为空，再退出主程序。

　　在使用这个模式时需要注意一点：通过将守护线程设置为 true，将允许主线程或者程序仅在守护线程处于活动状态时才能够退出。这种方式创建了一种简单的方式以控制程序流程，因为在退出之前，您可以对队列执行 join 操作、或者等到队列为空。队列模块文档详细说明了实际的处理过程，请参见参考资料：

join()

保持阻塞状态，直到处理了队列中的所有项目为止。在将一个项目添加到该队列时，未完成的任务的总数就会增加。当使用者线程调用 task_done() 以表示检索了该项目、并完成了所有的工作时，那么未完成的任务的总数就会减少。当未完成的任务的总数减少到零时，join() 就会结束阻塞状态。

参考：http://blog.csdn.net/yatere/article/details/7316487

　　 http://blog.csdn.net/liu1pan2min3/article/details/8545979

　　 http://www.ibm.com/developerworks/cn/aix/library/au-threadingpython/?ca=drs-tp3008

线程池原理及python实现的更多相关文章

5分钟看懂系列：Python 线程池原理及实现
概述传统多线程方案会使用"即时创建, 即时销毁"的策略.尽管与创建进程相比,创建线程的时间已经大大的缩短,但是如果提交给线程的任务是执行时间较短,而且执行次数极其频繁,那么服务器 ...
java多线程系类：JUC线程池：03之线程池原理（二）（转）
概要在前面一章"Java多线程系列--"JUC线程池"02之线程池原理(一)"中介绍了线程池的数据结构,本章会通过分析线程池的源码,对线程池进行说明.内容包 ...
Java多线程系列--“JUC线程池”03之线程池原理(二)
概要在前面一章"Java多线程系列--“JUC线程池”02之线程池原理(一)"中介绍了线程池的数据结构,本章会通过分析线程池的源码,对线程池进行说明.内容包括:线程池示例参考代 ...
Java多线程系列--“JUC线程池”04之线程池原理(三)
转载请注明出处:http://www.cnblogs.com/skywang12345/p/3509960.html 本章介绍线程池的生命周期.在"Java多线程系列--“基础篇”01之基 ...
Java多线程系列--“JUC线程池”05之线程池原理(四)
概要本章介绍线程池的拒绝策略.内容包括:拒绝策略介绍拒绝策略对比和示例转载请注明出处:http://www.cnblogs.com/skywang12345/p/3512947.html 拒绝策略 ...
Java线程池ThreadPoolExecutor使用和分析(三) - 终止线程池原理
相关文章目录: Java线程池ThreadPoolExecutor使用和分析(一) Java线程池ThreadPoolExecutor使用和分析(二) - execute()原理 Java线程池Thr ...
java多线程系列(六)---线程池原理及其使用
线程池前言:如有不正确的地方,还望指正. 目录认识cpu.核心与线程 java多线程系列(一)之java多线程技能 java多线程系列(二)之对象变量的并发访问 java多线程系列(三)之等待通知 ...
Java 并发编程——Executor框架和线程池原理
Eexecutor作为灵活且强大的异步执行框架,其支持多种不同类型的任务执行策略,提供了一种标准的方法将任务的提交过程和执行过程解耦开发,基于生产者-消费者模式,其提交任务的线程相当于生产者,执行任务 ...
Java并发——线程池原理
"池"技术对我们来说是非常熟悉的一个概念,它的引入是为了在某些场景下提高系统某些关键节点性能,最典型的例子就是数据库连接池,JDBC是一种服务供应接口(SPI),具体的数据库连接实 ...

随机推荐

Java 接口和抽象类区别(写的很好，转了）
原文:http://blog.csdn.net/sunboard/article/details/3831823 1.概述一个软件设计的好坏,我想很大程度上取决于它的整体架构,而这个整体架构其实就是 ...
<Android 应用之路> JuheNews For aNdroid (改进版)
简介最新版应用已经上线,欢迎下载使用,提出宝贵意见: http://shouji.baidu.com/software/10720907.html 上一篇介绍的是最开始自己制作的一个采用聚合数据免费 ...
[基础架构]PeopleSoft Web Server 重要文件说明
我们都知道PeopleSoft是由几个不同的服务组成的,他们在PeopleSoft体系结构中扮演着自己的角色.这些服务具有不同的文件结构并包含重要的可执行文件和配置文件. 以下是Peoplesoft体 ...
django 关于render的返回数据
1,问题探讨 : 通过ajax 发送请求,接受render返回的数据.到底是什么样的类型呢? def text(request): # v = reverse("test") # ...
声明元素<%! %>、Scriptlet元素<% %>、表达式元素<%= %>、注释元素、输出特殊符号<%和%>
声明元素 <%! 类成员声明或方法声明 %> 在声明元素中编写的代码,将转译为Servlet中的类成员或方法. 重新定义jspInit()方法,或是在jspDestroy(),就是在声明元 ...
使用redis 处理高并发场景
1.原理: 当同一个用户获取锁之后,会让该用户一直持有锁.同样的用户再次获取,会根据原子性 ,lock返回true. /** * 获取锁(非公平锁), 默认获取超时为2分钟 */ public bo ...
gradle中的compileSdkVersion和buildToolsVersion
CompileSdkVersion:编译版本,就是运行这个项目需要的SDK,即API Level. buildToolsVerson:是构建工具的版本,构建工具包括了打包工具aapt.dx等等. 注意 ...
sql server 存储过程的学习
存储过程学习笔记存储过程就是一条或者多条sql语句的集合,为了实现特定任务,而将一些需要多次调用的固定操作语句编写成程序段,这些程序段存储在服务器上,有数据库服务器通过程序来调用.T_SQL:存储过 ...
JBoss EAP应用服务器部署方法和JBoss 开发JMS消息服务小例子
一.download JBoss-EAP-6.2.0GA: http://jbossas.jboss.org/downloads JBoss Enterprise Application Platfo ...
django模板系统（上）
filters 过滤 default 替代作用 filesizeformat 格式化为人类可读 add 给变量加参数 lower 小写 upper 大写 title 标题 ljust 左对齐 rjus ...

线程池原理及python实现

线程池原理及python实现的更多相关文章

随机推荐

热门专题