多线程理解

多线程是多个任务同时运行的一种方式。比如一个循环中,每个循环看做一个任务,我们希望第一次循环运行还没结束时,就可以开始第二次循环,用这种方式来节省时间。

python中这种同时运行的目的是最大化利用CPU的计算能力,将很多等待时间利用起来。这也说明如果程序耗时不是因为等待时间,而是任务非常多,就是要计算那么久,则多线程无法改善运行时间。

更多有关多线程理解的内容可以参考下面资料

简单使用

先看下面这个函数

  1. import time
  2. def myfun():
  3. time.sleep(1)
  4. a = 1 + 1
  5. print(a)

如果我们要运行10次这个函数,它的运行时间主要在于每次sleep的那一秒,1 + 1的计算是不会耗多少时间的。这种情况可以用多线程提高效率。

下面来看一下不使用多线程耗时和使用多线程的耗时

不使用多线程

  1. t = time.time()
  2. for _ in range(5):
  3. myfun()
  4. print(time.time() - t)

得到结果是 5.002434492111206

下面我们使用多线程

  1. from threading import Thread
  2. for _ in range(5):
  3. th = Thread(target = myfun)
  4. th.start()

这样使用多线程其实就可以了,你会发现大概1秒,5个2会同时出来,说明5次循环其实几乎同时运行,5次1秒的等待时间同时进行,最后只等待了1秒。

这里多线程只包括了两步

  • Thread增加一个线程,这里是将每一次循环作为一次新的线程,一个线程执行一次myfun函数。
  • start()开始运行这个线程,每个线程都需要这样显式开启才会运行。一个线程这样开启后,不需要等待它运行完成,就可以继续运行下面的程序,即下一次循环(然后又新建了第二个线程,运行未结束即开启第三个……)

这里要注意一点:多线程是放在循环里面的,不能定义好循环之后,从外面将它变成多线程。

读者可能会注意到,不用多线程时是通过程序计算时间的,使用多线程却没有。这是因为要计算时间需要增加一些代码,无法展示最简单的多线程使用,所以就先不计算时间。接下来我们就讲join()的使用,并计算时间。

join的使用

线程的join()方法表示等这个线程运行完毕,程序再往下运行。我们来看下面的例子

  1. from threading import Thread
  2. t = time.time()
  3. for _ in range(5):
  4. th = Thread(target = myfun)
  5. th.start()
  6. th.join()
  7. print(time.time() - t)
  8. # 结果为 5.0047078132629395 秒

这里start()之后马上join(),表示每一个线程都要运行结束才能进行下一次循环,这样就和没有使用多线程没有区别了。不过如果要计算多线程运行时间却是要用到这个join()

我们先看一下不用join()的情况

  1. from threading import Thread
  2. t = time.time()
  3. for _ in range(5):
  4. th = Thread(target = myfun)
  5. th.start()
  6. print(time.time() - t)
  7. # 结果为 0.0009980201721191406 秒

它连1秒都没有等,就输出了结果,而且5个2是在打印出这个之后才输出出来的。这是因为print(time.time() - t)是区别于那5次循环线程之外的第6个线程,它不会等待5个线程运行结束就会开始运行。所以这样是无法获得上面5个线程的运行时间的,我们需要用join()等待5个线程都运行结束。

代码如下

  1. from threading import Thread
  2. t = time.time()
  3. ths = []
  4. for _ in range(5):
  5. th = Thread(target = myfun)
  6. th.start()
  7. ths.append(th)
  8. for th in ths:
  9. th.join()
  10. print(time.time() - t)
  11. # 结果为 1.0038363933563232

上面定义ths列表存储这些线程,最后用循环确保每一个线程都已经运行完成再计算时间差。

join()不只是用于这种情形。当一步代码运行依赖之前代码运行完成时,就要加入join()命令。

现在我们已经学完了多线程的一般使用方法,可以在多数场景使用了。下面来介绍一些细节

其他

(1)线程名称

我们直接看下面的代码

  1. import threading
  2. print(threading.current_thread().getName())
  3. def myfun():
  4. time.sleep(1)
  5. print(threading.current_thread().name)
  6. a = 1 + 1
  7. for i in range(5):
  8. th = threading.Thread(target = myfun, name = 'thread {}'.format(i))
  9. th.start()
  10. # 输出结果
  11. MainThread
  12. thread 0
  13. thread 1
  14. thread 4
  15. thread 3
  16. thread 2

解释一下

  • threading.current_thread()表示当前线程,可以调用namegetName()获取线程名称
  • 任何进程都会默认启动一个线程,默认名称为MainThread,也就是主程序占一个线程,这个线程和之后用Thread新加的线程是相互独立的,主线程不会等待其余线程运行结束就会继续往下运行。之前不用join()无法计算运行时间就是因为主线程先运行完了。
  • Thread表示运行这个函数启动一个新的线程,在其中加一个name参数指定这个函数线程名,则在这个函数内打印线程名就显示这里name参数对应值
  • 在循环中打印有两种。第一种print(threading.current_thread().name)则是MainThread;第二种print(th.name)则是thread 1

(2)Thread函数

上面我们使用了Thread函数的target name参数,下面来说一下它的其他参数

  • args指定target对应函数的参数,用元组传入,比如args = (3, )
  • daemon主线程默认是False,如果没有指定则继承父线程的值。True则如果主线程运行结束,该线程也停止运行;False则该线程会继续运行直到运行结束,无视主线程如何。(要看这个参数的效果要在py文件中编写代码,在cmd里运行,不能在jupyter notebook里,因为这里会多出一些线程干扰)
  • group是预留的一个参数,用于以后扩展ThreadGroup类,现在没用

(3)Thread对象

上面threading.Threadthreading.current_thread()都创建了一个Thread对象,Thread对象有如下属性和方法

  • getName() .name 获取线程名
  • setName() 设置线程名
  • start() join()这两个之前说过了
  • join()有一个timeout参数,表示等待这个线程结束时,如果等待时间超过这个时间,就不再等,继续进行下面的代码,但是这个线程不会被中断
  • run() 也是运行这个线程,但是必须等到这个线程运行结束才会继续执行之后的代码(如果将上面的start全换成run则相当于没有开多线程)
  • is_alive()如果该线程还没运行完,就是True否则False
  • daemon 返回该线程的daemon
  • setDaemon(True)设置线程的daemon

(4)threading

一些直接调用的变量

  • threading.currentThread(): 返回当前的线程变量
  • threading.enumerate(): 返回一个包含正在运行的线程的list
  • threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果

参考

Python Web学习笔记之Python多线程基础的更多相关文章

  1. Python Web学习笔记之Python多线程和多进程、协程入门

    进程和线程究竟是什么?如何使用进程和线程?什么场景下需要使用进程和线程?协程又是什么?协程和线程的关系和区别有哪些? 程序切换-CPU时间的分配 首先,我们的任何一个程序都需要运行在一个操作系统中,如 ...

  2. Python+Selenium学习笔记5 - python官网的tutorial - 交互模式下的操作

    这篇笔记主要是从Python官网的Tutorial上截取下来,再加上个人理解 1. 在交互模式下,下划线'_'还可以表示上一步的计算结果 2.引号转义问题. 从下图总结的规律是,字符串里的引号如果和引 ...

  3. Python Web学习笔记之多线程编程

    本次给大家介绍Python的多线程编程,标题如下: Python多线程简介 Python多线程之threading模块 Python多线程之Lock线程锁 Python多线程之Python的GIL锁 ...

  4. Python Web学习笔记之GIL机制下的鸡肋多线程

    为什么有人会说 Python 多线程是鸡肋?知乎上有人提出这样一个问题,在我们常识中,多进程.多线程都是通过并发的方式充分利用硬件资源提高程序的运行效率,怎么在 Python 中反而成了鸡肋? 有同学 ...

  5. Python Web学习笔记之TCP/IP、Http、Socket的区别

    经常在笔试.面试或者工作的时候听到这些协议,虽然以前没怎么涉及过,但至少知道这些是和网络编程密不可分的知识,作为一个客户端开发程序员,如果可以懂得网络编程的话,他的作用和能力肯定会提升一个档次.原因很 ...

  6. Python Web学习笔记之为什么设计GIL

    GIL(global interpreter lock),全局解释器锁,是很多编程语言实现中都具有的特性,由于它的存在,解释器无法实现真正的并发.它也是 Python 中经常讨论的话题之一. Pyth ...

  7. Python Web学习笔记之WebSocket原理说明

    众所周知,Web应用的通信过程通常是客户端通过浏览器发出一个请求,服务器端接收请求后进行处理并返回结果给客户端,客户端浏览器将信息呈现.这种机制对于信息变化不是特别频繁的应用可以良好支撑,但对于实时要 ...

  8. Python Web学习笔记之并发编程IO模型

    了解新知识之前需要知道的一些知识 同步(synchronous):一个进程在执行某个任务时,另外一个进程必须等待其执行完毕,才能继续执行 #所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调 ...

  9. Python Web学习笔记之socket编程

    Python 提供了两个基本的 socket 模块. 第一个是 Socket,它提供了标准的 BSD Sockets API. 第二个是 SocketServer, 它提供了服务器中心类,可以简化网络 ...

随机推荐

  1. HDU 1890 - Robotic Sort - [splay][区间反转+删除根节点]

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1890 Time Limit: 6000/2000 MS (Java/Others) Memory Li ...

  2. ORACLE中Drop table cascade constraints之后果.

    当你要drop一个table时,如果删除table的动作会造成trigger或constraint产生矛盾,系统会出现错误警告的讯息而不会允许执行..一个极简单的例子,例如你有一个员工基本资料表,上面 ...

  3. 单机闭环 使用Nginx+Lua开发高性能Web应用

    [西域骆驼D1532101213]西域骆驼(VANCAMEL)D1532101213 休闲套脚鞋 卡其43[行情 报价 价格 评测]-京东 http://item.jd.com/1856564.htm ...

  4. mysql八:视图、触发器、事务、存储过程、函数

    一 视图 视图是一个虚拟表(非真实存在),其本质是[根据SQL语句获取动态的数据集,并为其命名],用户使用时只需使用[名称]即可获取结果集,可以将该结果集当做表来使用. 使用视图我们可以把查询过程中的 ...

  5. 2015 湘潭大学程序设计比赛(Internet)H题-括号匹配

    括号匹配 Accepted : 30   Submit : 234 Time Limit : 10000 MS   Memory Limit : 65536 KB 题目描述 有一串括号(只包含&quo ...

  6. post方式提交数据

    <!DOCTYPE HTML><html>    <head>        <meta charset="utf-8" />   ...

  7. PHP主动断开与浏览器的连接

    以前整理过一篇<关于PHP连接处理中set_time_limit().connection_status()和ignore_user_abort()深入解析>,是解说浏览器client断开 ...

  8. 【CUDA并行程序设计系列(1)】GPU技术简介

    http://www.cnblogs.com/5long/p/cuda-parallel-programming-1.html 本系列目录: [CUDA并行程序设计系列(1)]GPU技术简介 [CUD ...

  9. ftp命令行敲不了

    最先安装了vsftpd,但是命令行敲ftp老是不行 解决方案:ftp命令是ftp客户端,vsftp是ftp服务器,两者不是一个概念.你需要安装ftp客户端 yum install ftp 可以自动安装 ...

  10. iqueryable lambda表达式

    1.groupby 1.group by var newLaborDtos = laborDtos.GroupBy(s => new { s.FinancingAmount, s.Company ...