摘录python核心编程

一般的,多线程代码中,总有一些特定的函数或者代码块不希望(或不应该)被多个线程同时执行(比如两个线程运行的顺序发生变化,就可能造成代码的执行轨迹或者行为不相同,或者产生不一致的数据),比如修改数据库、更新文件或其他会产生竞态条件的类似情况。此时就需要同步了。

同步:任意数量的线程可以访问临界区的代码,但在给定的时刻又只有一个线程可以通过时。

这里介绍两个基本的同步类型原语:锁/互斥、信号量

锁有两种状态:锁定和未锁定。与之对应的是两个函数:获得锁和释放锁。

  当多线程争夺锁时,允许第一个获得锁的线程进入临界区,并执行代码;所有之后到达的线程都将被阻塞,直到第一个线程执行结束,退出临界区,并释放锁。此时其他的线程可以获得锁并进入临界区。注意:那些被阻塞的线程是没有顺序的(并不是先到先得),意味着下一个获得锁的线程的顺序并不是确定的。

mtsleepF.py脚本中派生了随机数量的线程(没有使用锁):

  1. from atexit import register
  2. from random import randrange
  3. from threading import Thread,currentThread
  4. from time import ctime,sleep
  5.  
  6. #自定义一个集合对象,重写__str__方法
  7. class CleanOutputSet(set):
  8. def __str__(self):
  9. return ', '.join(x for x in self)
  10.  
  11. #列表生成式 randrange()用于生成一个随机数,range()返回一个列表
  12. loops = (randrange(2,5) for x in range(randrange(3,7)))
  13. remaining = CleanOutputSet()
  14.  
  15. def loop(nsec):
  16. myname = currentThread().name
  17. remaining.add(myname)
  18. print('[%s] 开始了 %s' % (ctime(),myname))
  19. sleep(nsec)
  20. remaining.remove(myname)
  21. print('[%s] 结束了 %s (%s second)' % (ctime(),myname,nsec))
  22. print(' (还存在:%s)' % (remaining or 'NONE'))
  23.  
  24. def _main():
  25. #创建3~6个线程,每个线程睡眠2~4秒
  26. for pause in loops:
  27. Thread(target = loop,args = (pause,)).start()
  28. #装饰器,在脚本的最后执行
  29. @register
  30. def _atexit():
  31. print('所有的完成于:',ctime())
  32.  
  33. if __name__ == '__main__':
  34. _main()

正常情况下,执行的结果:

  1. PS C:\Users\WC> python E:\Python3.6.3\workspace\mtsleepF.py
  2. [Mon Apr 16 17:47:31 2018] 开始了 Thread-1
  3. [Mon Apr 16 17:47:31 2018] 开始了 Thread-2
  4. [Mon Apr 16 17:47:31 2018] 开始了 Thread-3
  5. [Mon Apr 16 17:47:31 2018] 开始了 Thread-4
  6. [Mon Apr 16 17:47:33 2018] 结束了 Thread-1 (2 second)
  7. (还存在:Thread-4, Thread-3, Thread-2)
  8. [Mon Apr 16 17:47:33 2018] 结束了 Thread-2 (2 second)
  9. (还存在:Thread-4, Thread-3)
  10. [Mon Apr 16 17:47:34 2018] 结束了 Thread-3 (3 second)
  11. (还存在:Thread-4)
  12. [Mon Apr 16 17:47:34 2018] 结束了 Thread-4 (3 second)
  13. (还存在:NONE)
  14. 所有的完成于: Mon Apr 16 17:47:34 2018

我们多运行几次,有时会得到下面错乱的结果:

  1. PS C:\Users\WC> python E:\Python3.6.3\workspace\mtsleepF.py
  2. [Mon Apr 16 17:50:09 2018] 开始了 Thread-1
  3. [Mon Apr 16 17:50:09 2018] 开始了 Thread-2
  4. [Mon Apr 16 17:50:09 2018] 开始了 Thread-3
  5. [Mon Apr 16 17:50:12 2018] 结束了 Thread-3 (3 second)
  6. (还存在:Thread-2, Thread-1)
  7. [Mon Apr 16 17:50:13 2018] 结束了 Thread-1 (4 second)
  8. [Mon Apr 16 17:50:13 2018] 结束了 Thread-2 (4 second)
  9. (还存在:NONE)
  10. (还存在:NONE)
  11. 所有的完成于: Mon Apr 16 17:50:13 2018

我们发现输出存在部分混乱的情况(多个线程可能并行执行IO),还有就是两个线程修改同一个变量(剩余线程名集合)。IO和访问相同的数据结构都属于临界区,因此需要引入锁防止多个线程同时进入临界区。

下面是引入锁的脚本实例(mtsleepG.py):

  1. # python 3.6
  2. from atexit import register
  3. from random import randrange
  4. from threading import Thread,Lock,currentThread #2.6版本后重命名为current_thread()
  5. from time import ctime,sleep
  6.  
  7. #自定义一个集合类,重写—__str__方法,将默认输出改变为将其所有元素按照逗号分隔的字符串
  8. class CleanOutputSet(set):
  9. def __str__(self):
  10. return ', '.join(x for x in self)
  11. #三个全局变量
  12. lock = Lock()#锁
  13. loops = (randrange(2,5) for x in range(randrange(3,7)))#随机数量的线程(3~6个),每个线程暂停2~4
  14. remaining = CleanOutputSet()#自定义集合类的实例
  15.  
  16. def loop(nsec):
  17. myname = currentThread().name#获得当前线程的名称
  18. lock.acquire()#获取锁,阻止其他线程进入到临界区
  19. remaining.add(myname)#将线程名添加到集合中
  20. print('[%s] 开始 %s' % (ctime(),myname))
  21. lock.release()#释放锁
  22. sleep(nsec)#线程睡眠操作
  23. lock.acquire()#重新获得锁
  24. remaining.remove(myname)#从集合中删除当前线程
  25. print('[%s] 完成 %s (%s secs)' % (ctime(),myname,nsec))
  26. print(' (remaining: %s )' % (remaining or 'NONE'))
  27. lock.release()#最后释放锁
  28.  
  29. def _main(): #main函数前面添加‘_’是为了不在其他地方使用而导入。_main只能在命令行模式下才能执行
  30. for pause in loops:
  31. Thread(target = loop,args = (pause,)).start() #循环派生并执行每个线程
  32. #装饰器,注册_atexit()函数,使得解释器在脚本退出的时候执行此函数
  33. @register
  34. def _atexit():
  35. print('所有线程完成于:',ctime())
  36.  
  37. if __name__ == '__main__':
  38. _main()

多次执行,结果没有再出现混乱的情况:

  1. PS C:\Users\WC> python E:\Python3.6.3\workspace\mtsleepG.py
  2. [Tue Apr 17 19:54:31 2018] 开始 Thread-1
  3. [Tue Apr 17 19:54:31 2018] 开始 Thread-2
  4. [Tue Apr 17 19:54:31 2018] 开始 Thread-3
  5. [Tue Apr 17 19:54:31 2018] 开始 Thread-4
  6. [Tue Apr 17 19:54:31 2018] 开始 Thread-5
  7. [Tue Apr 17 19:54:31 2018] 开始 Thread-6
  8. [Tue Apr 17 19:54:33 2018] 完成 Thread-1 (2 secs)
  9. (remaining: Thread-5, Thread-3, Thread-4, Thread-6, Thread-2 )
  10. [Tue Apr 17 19:54:33 2018] 完成 Thread-5 (2 secs)
  11. (remaining: Thread-3, Thread-4, Thread-6, Thread-2 )
  12. [Tue Apr 17 19:54:34 2018] 完成 Thread-3 (3 secs)
  13. (remaining: Thread-4, Thread-6, Thread-2 )
  14. [Tue Apr 17 19:54:34 2018] 完成 Thread-2 (3 secs)
  15. (remaining: Thread-4, Thread-6 )
  16. [Tue Apr 17 19:54:35 2018] 完成 Thread-4 (4 secs)
  17. (remaining: Thread-6 )
  18. [Tue Apr 17 19:54:35 2018] 完成 Thread-6 (4 secs)
  19. (remaining: NONE )
  20. 所有线程完成于: Tue Apr 17 19:54:35 2018

信号量

当情况更加复杂的时候,还可以考虑使用信号量这个同步原语来代替锁。

信号量(Semaphore),是一个计数器,当资源消耗时递减(调用acquire),计数器会减1;当资源释放是递增(调用release),计数器会加1。计数器的值不会小于0;当等于0的时候,再调用acquire会阻塞,直到其他线程调用release为止。可以认为信号量代表他们的资源可用或不可用。

两个函数简介如下:

acquire(blocking=布尔值,timeout=None):

  • 本方法用于获得Semaphore
  • blocking默认值是True,此时,如果内部计数器值大于0,则减一,并返回;如果等于0,则阻塞,等待其他线程调用release()以使计数器加1;本方法返回True,或无线阻塞
  • 如果blocking=False,则不阻塞,如若获取失败,则返回False
  • 当设定了timeout的值,最多阻塞timeout秒,如果超时,返回False。

release():

  • 释放Semaphore,内部计数器加1,可以唤醒等待的线程

BoundedSemaphore正好和Semaphore相反:一个工厂函数,返回一个新的有界信号量对象。有界信号量会确保他的值不会超过初始值;如果超出则会抛出ValueError异常。初始值默认为1。

消耗资源使计数器递减的操作习惯上成为P(),也称为wait、try、acquire、pend、procure.

相对的,当一个线程对一个资源完成操作时,该资源需要返回资源池中,这种操作一般称为V(),也称为signal、increment、release、post、Vacate。

python简化了所有的命名,使用和锁的函数一样的名字:acquire和release。信号量比锁更加灵活,因为可以有多个线程,每个线程拥有有限资源的一个实例

下面,我们模仿一个简化的糖果机:该糖果机中只有5个可用的槽来保持库存(糖果),如果所有的槽都满了,糖果就不能再加到这个机器中了;相似的,如果每个槽都空了,消费者就不能再购买到了。我们使用信号量来追踪这些有限的资源(糖果槽)。

脚本实例candy.py:

  1. #python 3.6
  2. from atexit import register
  3. from random import randrange
  4. from threading import BoundedSemaphore,Lock,Thread#增加了信号量
  5. from time import sleep,ctime
  6. #3个全局变量
  7. lock = Lock()#锁
  8. MAX = 5 #表示库存糖果最大值的常量
  9. candytray = BoundedSemaphore(MAX)#‘糖果托盘’,一个信号量
  10. #向库存中添加糖果。这段代码是一个临界区,输出用户的行动,并在糖果超过最大库存的时候给出警告
  11. def refill():
  12. lock.acquire()
  13. print('重装糖果……')
  14. try:
  15. candytray.release()
  16. except ValueError:
  17. print('满了,跳过')
  18. else:
  19. print('成功')
  20. lock.release()
  21. #购买糖果。也是一个临界区,效果和refill函数相反
  22. def buy():
  23. lock.acquire()
  24. print('购买糖果中………')
  25. #检查是否所有的资源都已经消费完。
  26. #计数器的值不能小于0,所以这个调用一般会在计数器再次增加之前被阻塞。传入非阻塞标志False,让调用不再阻塞,而在应当阻塞的时候返回一个false,表示没有更多资源了。
  27. if candytray.acquire(False):
  28. print('成功')
  29. else:
  30. print('空,跳过')
  31. lock.release()
  32. #模拟糖果机的所有者
  33. def producer(loops):
  34. for i in range(loops):
  35. refill()
  36. sleep(randrange(3))
  37. #模拟消费者
  38. def consumer(loops):
  39. for i in range(loops):
  40. buy()
  41. sleep(randrange(3))
  42. #_main表示从命令行执行
  43. def _main():
  44. print('开始于:',ctime())
  45. nloops = randrange(2,6)
  46. print('糖果机(一共 %s 个槽)' % MAX)
  47. #创建消费者和所有者线程
  48. #其中消费者线程中,增加了额外的操作,用于随机给出正偏差,使得消费者真正消费的糖果数可能会比供应者放入机器的更多;否则代码永远不会进入消费者尝试从空机器购买糖果的情况
  49. Thread(target = consumer,args = (randrange(nloops,nloops+MAX+2),)).start()#
  50. Thread(target = producer,args = (nloops,)).start()
  51. #注册退出函数
  52. @register
  53. def _atexit():
  54. print('结束于:',ctime())
  55.  
  56. if __name__ == '__main__':
  57. _main()

执行结果类似:

  1. PS C:\Users\WC> python E:\Python3.6.3\workspace\candy.py
  2. 开始于: Wed Apr 18 19:56:19 2018
  3. 糖果机(一共 5 个槽)
  4. 购买糖果中………
  5. 成功
  6. 购买糖果中………
  7. 成功
  8. 重装糖果……
  9. 成功
  10. 重装糖果……
  11. 成功
  12. 重装糖果……
  13. 满了,跳过
  14. 购买糖果中………
  15. 成功
  16. 购买糖果中………
  17. 成功
  18. 购买糖果中………
  19. 成功
  20. 购买糖果中………
  21. 成功
  22. 购买糖果中………
  23. 成功
  24. 购买糖果中………
  25. 空,跳过
  26. 购买糖果中………
  27. 空,跳过
  28. 结束于: Wed Apr 18 19:56:27 2018

python多线程编程—同步原语入门(锁Lock、信号量(Bounded)Semaphore)的更多相关文章

  1. python多线程编程(3): 使用互斥锁同步线程

    问题的提出 上一节的例子中,每个线程互相独立,相互之间没有任何关系.现在假设这样一个例子:有一个全局的计数num,每个线程获取这个全局的计数,根据num进行一些处理,然后将num加1.很容易写出这样的 ...

  2. Python多线程中阻塞(join)与锁(Lock)的使用误区

    参考资料:https://blog.csdn.net/cd_xuyue/article/details/52052893 1使用两个循环分别处理start和join函数.即可实现并发. threads ...

  3. day-3 python多线程编程知识点汇总

    python语言以容易入门,适合应用开发,编程简洁,第三方库多等等诸多优点,并吸引广大编程爱好者.但是也存在一个被熟知的性能瓶颈:python解释器引入GIL锁以后,多CPU场景下,也不再是并行方式运 ...

  4. python多线程编程

    Python多线程编程中常用方法: 1.join()方法:如果一个线程或者在函数执行的过程中调用另一个线程,并且希望待其完成操作后才能执行,那么在调用线程的时就可以使用被调线程的join方法join( ...

  5. 《Python黑客编程之极速入门》正式开课

    玄魂 玄魂工作室 今天 之前开启了一个<Python黑客编程>的系列,后来中断了,内容当时设置的比较宽,不太适合入门.现在将其拆分成两个系列<Python黑客编程之极速入门>和 ...

  6. Python并发编程-GIL全局解释器锁

    Python并发编程-GIL全局解释器锁 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.GIL全局解释器锁概述 CPython 在解释器进程级别有一把锁,叫做GIL,即全局解释 ...

  7. Python函数式编程:从入门到走火入魔

    一行代码显示"爱心" >>> print]+(y*-)**-(x**(y*<= ,)]),-,-)]) Python函数式编程:从入门到走火入魔 # @fi ...

  8. 关于python多线程编程中join()和setDaemon()的一点儿探究

    关于python多线程编程中join()和setDaemon()的用法,这两天我看网上的资料看得头晕脑涨也没看懂,干脆就做一个实验来看看吧. 首先是编写实验的基础代码,创建一个名为MyThread的  ...

  9. Java多线程编程(同步、死锁、生产消费者问题)

    Java多线程编程(同步.死锁.生产消费): 关于线程同步以及死锁问题: 线程同步概念:是指若干个线程对象并行进行资源的访问时实现的资源处理保护操作: 线程死锁概念:是指两个线程都在等待对方先完成,造 ...

随机推荐

  1. Vue组件通信之非父子组件传值

    前言: 如果想要了解非父子关系的组件传值,最好是在了解父传子和子传父的基础上在来了解非父子传值可能会有更透彻的思路. 因为非父子传值是通过定义事件总线来代理实现父传子+子传父从而实现的传值方式. 这是 ...

  2. python基本文件操作

    python文件操作 python的文件操作相对于java复杂的IO流简单了好多,只要关心文件的读和写就行了 基本的文件操作 要注意的是,当不存在某路径的文件时,w,a模式会自动新建此文件夹,当读模式 ...

  3. selenium处理iframe和动作链

    selenium处理iframe和动作链 iframe iframe就是一个界面里嵌套了其他界面,这个时候selenium是不能从主界面找到子界面的属性,需要先找到子界面,再去找子界面的属性 动作链( ...

  4. ios图片适配问题

    在不同的系统中显示不同的图片 代码优化 抽取一个分类

  5. SpringSecurity框架下实现CSRF跨站攻击防御

    一.什么是CSRF 很多朋友在学习Spring Security的时候,会将CORS(跨站资源共享)和CSRF(跨站请求伪造)弄混,以为二者是一回事.其实不是,先解释一下: CORS(跨站资源共享)是 ...

  6. 三角形列表前缀.html

    发过火刮腹湔肠封官赐爵法规及法规及提供 发过火刮腹湔肠封官赐爵法规及法规及提供 发过火刮腹湔肠封官赐爵法规及法规及提供 发过火刮腹湔肠封官赐爵法规及法规及提供 发过火刮腹湔肠封官赐爵法规及法规及提供 ...

  7. 【Python成长之路】词云图制作

    [写在前面] 以前看到过一些大神制作的词云图 ,觉得效果很有意思.如果有朋友不了解词云图的效果,可以看下面的几张图(图片都是网上找到的): 网上找了找相关的软件,有些软件制作 还要付费.结果前几天在大 ...

  8. 带着canvas去流浪系列之三 绘制饼图

    [摘要] 用canvas原生API绘制Echarts图表 示例代码托管在:http://www.github.com/dashnowords/blogs 一. 任务说明 使用原生canvasAPI绘制 ...

  9. 使用jieba分析小说太古神王中,男主更爱谁?去文章中找答案吧!#华为云·寻找黑马程序员#

    欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字"加群",加入华为云线上技术讨论群:输入关键字"最新活动",获取华 ...

  10. 如何运用DDD - 领域服务

    目录 如何运用DDD - 领域服务 概述 什么是领域服务 从实际场景下手 更贴近现实 领域服务VS应用服务 扩展上面的需求 最常见的认证授权是领域服务吗 使用领域服务 不要过多的使用领域服务 不要将过 ...