Python基础—线程、进程和协程

今天已是学习Python的第十一天，来干一碗鸡汤继续今天的内容，今天的鸡汤是：超越别人对你的期望。本篇博客主要介绍以下几点内容：

线程的基本使用；
线程的锁机制；
生产者消费之模型(队列)；
如何自定义线程池；
进程的基本使用；
进程的锁机制；
进程之间如何实现数据共享；
进程池；
协程的基本使用。

一、线程

1、创建线程

上篇博客已经介绍过如何创建多线程的程序，在这里在复习一下如何创建线程过程以及线程的一些方法：

import threading

class MyThread(threading.Thread): #首先继承线程类

def __init__(self,func,args):

self.func = func

self.args = args

super(MyThread,self).__init__() #执行父类的所有构造方法

def run(self): #因为会在创建线程后自动触发run方法，我们自定义run方法，让线程来执行此方法

self.func(self.args)

def f1(args):

print(args)

obj = MyThread(f1,123)

obj.start() #开启线程

#结果输出：

123

线程的方法：

start：线程准备就绪，等待CPU调度；
setName：为线程设置名称；
getName：获取线程名称；
setDaemon(布尔值)：设置为主线程是否等待子线程执行(默认False)；

如果是将setDaemon设置成True，主线程执行过程中，子线程也在进行，主线程执行完毕后，子线程不论成功与否，均停止主线程不会等子线程；

如果值为False，主线程执行过程中，子线程也在执行，主线程执行完毕后，等待子线程也执行完成后，程序停止。

join(秒)：表示主线程到此，会等待子线程执行，参数表示主线程在此最多等待N秒后，继续往下执行；
run：线程被CPU调度后自动执行线程对象的run方法。

2、线程的锁机制

下面我们来介绍一下线程的锁机制，由于线程之间是进行随机调度，并且每个线程可能只执行N条操作，当多个线程同时修改同一条数据时可能会出现脏数据，所以出现了线程锁。在python中分为三种线程锁：互斥锁(lock,Rlock)、信号量(Semaphore)、事件(event)，还有一个条件(Condition)配合线程锁来使用，下面分别介绍这几种锁：

(1)、互斥锁(lock,Rlock)

我们先看一下不加线程锁的程序的执行结果：

import threading

import time

NUM = 10

def func(i):

global NUM

NUM -=1

time.sleep(1)

print(NUM)

for i in range(10): #创建10个线程,去执行上面的函数

t = threading.Thread(target=func,args=(i,))

t.start()

#因为没有线程锁,10个线程同时去修改上面的NUM,导致出现脏数据,结果：

0

当我们加上线程锁后，效果就会避免上面现象的发生：

import threading

import time

NUM = 10

def func(i,l):

global NUM

l.acquire() #加锁，

NUM -=1

time.sleep(2)

print(NUM,i)

l.release() #开锁

# lock = threading.Lock() #只能锁一次，一般不推荐使用

lock = threading.RLock() #推荐使用Rlock，可以在程序中锁一次或多次，一次性只能允许一个线程操作

for i in range(10):

t = threading.Thread(target=func,args=(i,lock,))

t.start()

#结果:

9 0

8 1

7 2

6 3

5 4

4 5

3 6

2 7

1 8

0 9

(2)、信号量(Semaphore)

上面我们介绍了互斥锁，我们发现，互斥锁同时只能允许一个线程更改数据，而Semaphore是同时允许一定数量的线程更改数据，比如肯德基有3个购餐的窗口，那最多只允许3个人购买，后面的人只能等前面的人买完才能购买。

import threading

import time

NUM = 10

def func(i,l):

global NUM

l.acquire() #加锁，

NUM -=1

time.sleep(1)

print(NUM,i)

l.release() #开锁

lock = threading.BoundedSemaphore(5) #一次可以允许多个线程更改数据

for i in range(10):

t = threading.Thread(target=func,args=(i,lock,))

t.start()

#结果5个线程同时修改数据：

5 0

4 1

3 3

3 2

1 4

0 6

0 5

0 7

0 9

0 8

(3)、事件(event)

Python线程的事件用于主线程控制其他线程的执行，事件主要提供了三个方法：set、wait、clear。

事件处理的机制：全局定义了一个"Flag",如果"Flag"值为Flase，那么当程序执行event.wait方法时就会阻塞，如果"Flag"值为True，那么event.wait方法时便不再阻塞。

event.clear：将"Flag"设置成False，(加锁);
event.set：将"Flag"设置成True，(解锁)。

import threading

def func(i,e):

print(i)

e.wait()

#检测是什么状态，如果是锁状态，会在此等待，如果无锁状态，直接执行下面操作，默认是锁状态

print(i+100)

event = threading.Event()

for i in range(10):

t = threading.Thread(target=func,args=(i,event,))

t.start()

event.clear() #主动设置成锁状态

inp = input(">>>:")

if inp =='1':

event.set() #解锁

#结果：

0

1

2

3

4

5

6

7

8

9

>>>:1

100

102

103

104

105

107

108

109

101

106

(4)、条件(Condition)

使得线程等待,只有满足条件的时候，才释放N个线程去更改数据，下面通过两种方法来演示加条件的线程锁操作：

import threading

def func(i,con):

print(i)

con.acquire()

con.wait() #代码执行到这会阻塞，当主线程条件成立后，才会继续往下执行

print(i+100)

con.release()

c = threading.Condition() #创建条件，满足这个条件会执行线程

for i in range(10):

t = threading.Thread(target=func,args=(i,c,))

t.start()

while True:

inp = input('>>>:') #获取用户输入,输入几,允许几个线程操作

if inp =='q':

break

c.acquire()

c.notify(int(inp))

#notify:通知其他线程，那些挂起的线程接到这个通知之后会开始运行。通常三个方法放一起，代码格式规定

c.release()

#结果：

0

1

2

3

4

5

6

7

8

9

>>>:2

>>>:100

101

3

>>>:103

102

104

import threading

def condition():

ret = False

r = input('>>>:') #获取用户输入，如果是true,就允许一个线程执行

if r == 'true':

ret = True

else:

ret = False

return ret

def func(i,con):

print(i)

con.acquire()

con.wait_for(condition)

print(i+100)

con.release()

c = threading.Condition()

for i in range(10):

t = threading.Thread(target=func,args=(i,c,))

t.start()

#结果：

>>>:1

2

3

4

5

6

7

8

9

true

100

>>>:

(5)、Timer

Timer：定时器，指定N秒之后执行某操作。

from threading import Timer

def hello():

print("hello, world")

t = Timer(1, hello) #线程等待1秒，执行后面的函数

t.start()

3、生产者消费者模型(队列)

Queue模块实现了多生产者、多消费者队列，它特别适用于多线程编程。Queue类中实现了所有需要的锁语义，Queue模块实现了四种类型的队列：

queue.Queue：先进先出队列(FIFO),第一加入队列的任务，被第一个取出；
queue.LifoQueue：后进先出队列(LIFO),最后加入队列的任务，被第一个取出
queue.PriorityQueue：优先级队列，保持队列数据有序，是根据权重判断取出顺序，最小值被先取出。
queue.deque：双向队列，一种支持向两端高效地插入数据、支持随机访问的容器

下面通过例子来详细介绍一下先进先出队列的使用方法：

queue.Queue(先进先出)：

import queue

q = queue.Queue(2) #队列最大支持两个链接

q.put(11) #向队列中放入元素

q.put(12)

print(q.qsize()) #输出队列的的大小

print(q.get()) #移除列队元素并将元素返回

print(q.get())

#结果：

2 #表示队列中有两个元素

11

12

import queue

q = queue.Queue(2) #队列最大支持两个链接

q.put(11) #向队列中放入元素

q.put(12)

print(q.empty()) #判断队列是否为空

#q.put(22)                        #如果队列里满了，会在此阻塞，因为队列最大支持两个链接

#q.put(22,timeout=2) #如果我们使用这种方式会在这阻塞2秒然后报错

q.put(33,block=False,timeout=2) #block= False 设置程序不阻塞，直接报错

print(q.get())

# print(q.get()) #同样在移除元素的时候也有相同的方法,可以设置超时时间

print(q.get(timeout=2))

#结果,报错：

File "E:/project/Day11/线程/s1.py", line 51, in <module>

q.put(33,block=False,timeout=2)

File "C:\Users\Henry\AppData\Local\Programs\Python\Python35\lib\queue.py", line 130, in put

raise Full

queue.Full

import queue

q = queue.Queue(5)

q.put(123)

q.put(456)

print(q.get())

q.task_done()

#在完成一项工作后，会向队列发送一个确认信号，知道取完数据后，join才会终止程序，要么join会一直阻塞

print(q.get())

q.task_done()

q.join() #实际上意味着等到队列为空，再执行别的操作

#结果：

123

456

通过上面的例子，我们总结一下queue队列提供的公共方法：

Queue.put：向队列中放入元素，block是否阻塞(默认True)，timeout阻塞时的超时时间；
Queue.get：移除队列中的元素，block是否阻塞，timeout阻塞时超时时间；
queue.Queue(Maxsize)：Maxsize,设置队列支持最大的个数；
Queue.qsize：队列的真实个数；
Queue.join,Queue.task_done：阻塞进程，当队列中任务执行完毕后，不再阻塞；
Queue.empty：判断队列是否为空。

queue.LifoQueue(后进先出)：

import queue

q = queue.LifoQueue() #后进先出

q.put(123)

q.put(456)

print(q.get())

#结果：

456

queue.PriorityQueue(优先级队列)：

q = queue.PriorityQueue() #根据优先级处理

q.put((1,"jack1")) #在优先级相同的情况下，后根据顺序输出

q.put((2,"jack2"))

q.put((3,"jack3"))

print(q.get())

#结果：

(1, 'jack1')

queue.deque(高性能双向队列)：

import queue

q= queue.deque() #双向队列

q.append((123))

q.append(234)

q.appendleft(456) #从左边去一个值

print(q.pop())

print(q.popleft())

#结果：

234

456

为什么说它是高性能的队列我们来对比双向队列、普通队列和列表的处理速度我们一起来看一下：

import time

import queue

import collections

q = collections.deque()

t0 = time.clock()