python 四——线程、进程、协程
内容概要
1、进程与线程优、缺点的比较
2、适用情况
3、线程
线程的创建
setDaemon
join
event
RLock
队列
4、进程
创建进程
setDaemon
join
线程与进程,数据之间是否共享对比
特殊的数据容器
进程池
5、协程
1、进程与线程优、缺点的比较
总言:使用进程和线程的目的,提高执行效率。
进程:
优点:能利用机器的多核性能,同时进行多个操作。
缺点:需要耗费资源,重新开辟内存空间,耗内存。
线程:
优点:共享内存(资源),做IO操作时,可以创造并发操作。
缺点:抢占资源。
总结:进程并不是越多越好,最好CPU个数 = 进程个数。
线程也并不是越多越好,应根据业务需求来确定个数,因为请求上下文切换非常耗时。
2、适用情况
IO密集型(不用CPU) :适合多线程
计算密集型(要用CPU):适合多进程
3、线程
(1)线程的创建(threading模块)
import threading #导入该模块
import time def f0():
pass def f1(a1,a2):
time.sleep(1)
print(a1,a2)
f0() #创建子线程,任务为f1(),参数为args的元祖
t = threading.Thread(target=f1,args=(123,456,))
#默认setDaemon为false,主线程要等待子线程执行完毕后再结束
#设置为True后,就不等待
t.setDaemon(True)
t.start() #告诉线程我们准备好了
(2)主线程是否等待子线程
t.setDaemon(True/False)
用于设置主线程执行完毕后,是否等待子线程,默认为false,要等待。
(3)主线程是否等待某个子线程执行完毕
t.join() 一直等待
t.join(2)最多等待该子线程2s
(4)线程锁RLock
避免因并发操作而造成脏数据,线程锁能锁住全部子线程,同一时刻允许一个线程执行操作。
#未使用线程锁时
import threading
import time gl_num = 0 def show(arg):
global gl_num
time.sleep(0.5)
gl_num +=1
print(gl_num) #开了10个线程,同时都对全局变量gl_num进行操作
for i in range(10):
t = threading.Thread(target=show, args=(i,))
t.start() print('main thread stop')
#使用了线程锁时
import threading
import time gl_num = 0 lock = threading.RLock() #创建锁 def Func():
lock.acquire() #锁定
global gl_num
gl_num += 1
time.sleep(0.25)
print(gl_num)
lock.release() #释放锁 for i in range(10):
t = threading.Thread(target=Func)
t.start()
print('main thread stop')
(5)事件(Event)
python线程的事件用于主线程控制其他线程的执行,事件主要提供了三个方法 set、wait、clear。
事件处理的机制:全局定义了一个“Flag”,如果“Flag”值为 False,那么当程序执行 event.wait 方法时就会阻塞,如果“Flag”值为True,那么event.wait 方法时便不再阻塞。
event.wait() 等待绿灯开启,再继续执行
event.clear()设为红灯
event.set() 设为绿灯
import threading def do(event):
print('start')
event.wait() #阻塞住,等待绿灯。event_obj.set()语句执行后,又回来继续执行下一句
print('execute') event_obj = threading.Event()
for i in range(3):
t = threading.Thread(target=do, args=(event_obj,))
t.start() event_obj.clear() #设为红灯
inp = input('input:')
if inp == 'true':
event_obj.set() #设为绿灯
执行结果:
start
start
start
input:true
execute
execute
execute
(6)生产者消费者模型、队列(先进先出)(queue模块)
4、进程
(1)创建进程(multiprocessing模块)
import multiprocessing
import time def f1(a1):
time.sleep(3)
print(a1) if __name__ == '__main__': #Windows上,进程语句必须放在main里面
#创建进程,任务为执行f1(),参数为11,由元祖封装
t = multiprocessing.Process(target=f1,args=(11,))
# 当daemon设为true时,主进程结束后就不再等待子进程了,默认为false要等待
t.daemon = True #所以结果没有打印出 11
t.start() t = multiprocessing.Process(target=f1,args=(22,))
t.start()
print('end')
(2)主进程是否等待子进程
t.setDaemon(True/False)
用于设置主进程执行完毕后,是否等待子进程,默认为false,要等待。
(3)主进程是否等待某个子进程执行完毕
t.join() 一直等待
t.join(2)最多等待该子进程2s
(4)线程与进程,数据之间是否共享对比
默认每个进程之间的数据是不共享的,各做各的。
而每个线程之间的数据是共享的。
#进程操作时,数据是不共享的
from multiprocessing import Process li = []
def foo(i):
li.append(i)
print('say hi',li) if __name__ == '__main__':
for i in range(10):
p = Process(target=foo,args=(i,))
p.start()
结果为:
say hi [0]
say hi [2]
say hi [1]
say hi [3]
say hi [4]
say hi [5]
say hi [6]
say hi [7]
say hi [9]
say hi [8]
线程处理时,数据是共享的,将process改为thread,结果为:
say hi [0]
say hi [0, 1]
say hi [0, 1, 2]
say hi [0, 1, 2, 3]
say hi [0, 1, 2, 3, 4]
say hi [0, 1, 2, 3, 4, 5]
say hi [0, 1, 2, 3, 4, 5, 6]
say hi [0, 1, 2, 3, 4, 5, 6, 7]
say hi [0, 1, 2, 3, 4, 5, 6, 7, 8]
say hi [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
(5)特殊的数据容器
如果想要多个进程同时操作一份数据,则需要特殊的容器。
方法一:Array数组(不推荐)
a.创建时需要规定大小,切不能改变。
b.内部数据必须统一为相同类型,字符串、数字等。
方法二:manager.dict()共享数据(推荐)
创建: m = Manager()
dict = m.dict()
from multiprocessing import Process,Manager def Foo(i,dic):
dic[i] = 100+i
print(len(dic)) # for k,v in dic.items():
# print(k,v)
if __name__ == '__main__':
manager = Manager()
dic = manager.dict()
# dic = {} #dic为普通字典时,返回值为 1 1 for i in range(2):
p = Process(target=Foo,args=(i,dic))
p.start()
p.join()
返回值为:1 2
(6)进程池(python中已创建好) pool
from multiprocessing import Pool
import time def f1(a1):
time.sleep(1)
print(a1)
return 1000 def f2(arg):
print(arg) if __name__ == '__main__': pool = Pool(5)
# pool.apply(f1,(2,))
for i in range(10):
pool.apply_async(func=f1, args=(i,), callback=f2)#特别注意args跟的参数为元祖类型
#callback=f2表示回调函数,将f1 return的值作为参数传给f2
pool.close()
pool.join()#等待子进程执行完
pool.apply()和pool.apply_async()对比:
pool.apply() :每一个任务都是排队执行的,内部有join()方法,会等待子进程
pool.apply_async():每一个任务都是并发执行,且可以设置回调函数,内部无join()方法,
进程deamon = true,不等待子进程,要想等待子进程,需先pool.close(),再pool.join() 5、协程(高性能代名词) 线程和进程的操作时程序出发系统接口,最后的执行者是系统,协程的操作则是程序员。 存在意义:只使用一个线程,在一个线程中规定某个代码块执行顺序。
适用于: IO密集型操作 方法一:greenlet模块
需手动切换任务(不推荐) 方法二:gevent模块(本质也是基于greenlet)
自动切换任务,谁先回来就先处理谁(推荐)
import gevent def foo():
print('')
gevent.sleep(0) #切换标志
print('') def bar():
print('')
gevent.sleep(0) #切换标志
print('') gevent.joinall([
gevent.spawn(foo),
gevent.spawn(bar),
])
结果为: 1 3 2 4
补充知识点:http://www.cnblogs.com/wupeiqi/articles/6229292.html
python 四——线程、进程、协程的更多相关文章
- python中线程 进程 协程
多线程:#线程的并发是利用cpu上下文的切换(是并发,不是并行)#多线程执行的顺序是无序的#多线程共享全局变量#线程是继承在进程里的,没有进程就没有线程#GIL全局解释器锁#只要在进行耗时的IO操作的 ...
- 学到了林海峰,武沛齐讲的Day34 完 线程 进程 协程 很重要
线程 进程 协程 很重要 ...儿子满月回家办酒,学的有点慢,坚持
- Python学习笔记整理总结【网络编程】【线程/进程/协程/IO多路模型/select/poll/epoll/selector】
一.socket(单链接) 1.socket:应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口.在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socke ...
- 11.python之线程,协程,进程,
一,进程与线程 1.什么是线程 线程是操作系统能够进行运算调度的最小单位.它被包含在进程之中,是进程中的实际运作单位.一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行 ...
- 文成小盆友python-num11-(1) 线程 进程 协程
本节主要内容 线程补充 进程 协程 一.线程补充 1.两种使用方法 这里主要涉及两种使用方法,一种为直接使用,一种为定义自己的类然后继承使用如下: 直接使用如下: import threading d ...
- 15.python并发编程(线程--进程--协程)
一.进程:1.定义:进程最小的资源单位,本质就是一个程序在一个数据集上的一次动态执行(运行)的过程2.组成:进程一般由程序,数据集,进程控制三部分组成:(1)程序:用来描述进程要完成哪些功能以及如何完 ...
- python 线程 进程 协程 学习
转载自大神博客:http://www.cnblogs.com/aylin/p/5601969.html 仅供学习使用···· python 线程与进程简介 进程与线程的历史 我们都知道计算机是由硬件和 ...
- python之并发编程(线程\进程\协程)
一.进程和线程 1.进程 假如有两个程序A和B,程序A在执行到一半的过程中,需要读取大量的数据输入(I/O操作),而此时CPU只能静静地等待任务A读取完数据才能继续执行,这样就白白浪费了CPU资源.是 ...
- python学习笔记-(十四)进程&协程
一. 进程 1. 多进程multiprocessing multiprocessing包是Python中的多进程管理包,是一个跨平台版本的多进程模块.与threading.Thread类似,它可以利用 ...
- python之线程进程协成
线程与进程 什么是线程 线程是进程一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位,线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源,但是它可与同属一个线程的 ...
随机推荐
- Redis 数据导入导出,redis-dump命令
安装redis-dump 工具 yum install ruby rubygems ruby-devel# 修改为国内源gem sources --add http://gems.ruby-china ...
- 修改Azure Website默认时区
Azure Website默认时区为国际标准时间,对中国用户来说不太方便友好,如何设置成北京时间呢? 打开Azure Website的“配置”页,找到“应用设置”节点. 在应用设置中添加设置项,密钥为 ...
- 《超实用的HTML代码段》阅读笔记1——HTML5自动聚焦
在页面加载完成后自动将输入焦点定位到需要的元素,用户就可以直接在改元素中进行输入而不需要手动选择它. 通过autofocus的属性就可以指定这种自动聚焦的功能,示例代码如下: <form nam ...
- 【读书笔记】构建之法(CH4~CH6)
从chapter4至chapter6,围绕着构建过程的合作讨论构建之法,而合作与个人工作的区别却以一个微妙的问题为开端:阅读别人的代码有多难? 两人合作:(驾驶员与领航员) 合作要注意代码风格规范与设 ...
- java 序列化Serializable 详解
Java 序列化Serializable详解(附详细例子) 1.什么是序列化和反序列化Serialization(序列化)是一种将对象以一连串的字节描述的过程:反序列化deserialization是 ...
- sql语句执行碰到的问题
问题:传递给 LEFT 或 SUBSTRING 函数的长度参数无效 原因:在LEFT或SUBSTRING 中计算出来的长度是负数导致的 解决方法: 1)逐个排查法,2)先把语句执行一下,查看中断的地 ...
- [文章泛读] The varying faces of a program transformation systems (ACM Inroads, 2012)
Beevi S. Nadera, D. Chitraprasad, and Vinod S. S. Chandra. 2012. The varying faces of a program tran ...
- webpack打包性能分析
1. 如何定位webpack打包速度慢的原因 首先需要定位webpack打包速度慢的原因,才能因地制宜采取合适的方案,我们可以在终端输入: webpack --profile --json > ...
- [NOI2010]海拔——最小割+对偶图
题目链接 SOLUTION 想一下最优情况下肯定让平路或下坡尽量多,于是不难想到这样构图:包括左上角的一部分全部为\(0\),包括右下角的一部分全部为\(1\),于是现在问题转化为求那个分界线是什么. ...
- ERROR 2003 (HY000): Can't connect to MySQL server on 'localhost' (10061) : 第一次设置MySQL也适用
[MySQL的安装环境]:windows7 64位 [MySQL的版本]:mysql-8.0.16-winx64 [错误描述]: ERROR 2003 (HY000): Can't connect t ...