python学习之-- 进程和线程

python 进程/线程详解

进程定义：以一个整体的形式暴露给操作系统管理，它里面包含对各种资源的调用，内存的管理，网络接口的调用等等，对各种资源管理的集合，就可以叫做一个进程。

线程定义：线程是操作系统能够进行运算调度的最小单位（是一串指令的集合）。它被包含在进程之中，是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流，一个进程中可以并发多个线程，每条线程并行执行不同的任务。

另说明：进程是不能直接操作CPU执行的，每个进程的执行都是默认创建一个主线程来操作CPU进行执行指令集合。

进程和线程的区别：

1：同一进程内的多个线程之间是共享内存空间，每个进程的内存是独立的。
2：同一个进程内的线程之间可以直接交流，而俩个进程如果想通讯，必须通过一个中间代理来实现，如（进程队列，管道，manage）。
3：创建新线程很简单，创建新进程需要对其父进程进行一次克隆。
4：一个线程可以控制和操作同一进程里的其他线程，但是进程只能操作子进程.

举例一个最简单的多线程实现并发效果：

 import threading,time

 def fun(n): # 定义一个函数，每次打印后等待2秒钟退出

     print(n)

     time.sleep(2)

 for i in range(5):

     t = 't%d' % i

     # 通过线程并发执行5次

     t = threading.Thread(target=fun,args=('jack',))

     t.start()

举例：一个继承式多线程写法（只是一种方法而已）

 import threading,time

 class MyThread(threading.Thread):

     def __init__(self,n):

         # 重写父类中的属性值

         super(MyThread,self).__init__()

         self.n = n

     def run(self): # 这里的run为固定模式，就是重写父类中的run方法

         print('输出的字符串为：',self.n)

         time.sleep(2)

 for i in range(50): # 一次执行了50个线程

     n = 'n'+str(i)

     t = MyThread(n)

     t.start()

举例：判断每个线程执行的时间

 class MyThread(threading.Thread):

     '''继承线程类并重写run方法'''

     def __init__(self,n):

         super(MyThread,self).__init__()

         self.n = n

      # 函数为启动的子线程执行的

     def run(self):

         print('输出的字符串为：',self.n)

         time.sleep(2)

 # 以下为主线程的执行

 obj_list = []

 for i in range(50):

     n = 'n'+str(i)

     t = MyThread('t1')

     t.start()

     # 将每个线程内存添加到列表中

     obj_list.append(t)

 new_time = time.time()

 for j in obj_list:

     # 等待每个线程执行完成后，计算线程的用时

     j.join()

     out_time = time.time() - new_time

     print('用时：',out_time)

 print('所有线程一共用时:%s' % (time.time()-new_time))

守护线程：主线程退出时不会等待守护线程是否执行完毕，只会等待非守护线程执行完才退出。
使用情况：一般用于socketserver端，启动多个守护线程，当主线程关闭了，子线程就自动关闭，否则关闭主线程需等待子线程关闭了才可以关闭。

举例：将子线程修改为守护线程

 class MyThread(threading.Thread):

     def __init__(self,n):

         super(MyThread,self).__init__()

         self.n = n

     def run(self):

         print('输出的字符串为：',self.n)

         time.sleep(2)

 new_time = time.time()

 for i in range(50):

     n = 'n'+str(i)

     t = MyThread('t1')

     # 如下将线程t 通过setDaemon即声明为一个守护线程

     t.setDaemon(True)

     t.start()

 print('所有线程一共用时:%s' % (time.time()-new_time))

GIL （全局解释器锁）

对Python 虚拟机的访问由全局解释器锁（GIL）来控制，正是这个锁能保证同一时刻只有一个线程在运行。
在多线程环境中，Python 虚拟机按以下方式执行：
1. 设置GIL
2. 切换到一个线程去运行
3. 运行：
a. 指定数量的字节码指令，或者
b. 线程主动让出控制（可以调用time.sleep(0)）
4. 把线程设置为睡眠状态
5. 解锁GIL
6. 再次重复以上所有步骤

举例：线程手工加锁方法

 import threading

 lock = threading.Lock()  #　实例化一个锁

 num = 0

 def fun():

     lock.acquire()　　＃加锁

     global  num

     num += 1

     lock.release()　　＃解锁　这样就在并发线程中将多个线程进行串行，也实现了对同一块内存进行操作

 for i in range(50):

     n = threading.Thread(target=fun,args=())

     n.start()

 print('num:',num)

 输出：num: 50

递归锁：一个外部锁内还有个子锁。（就是锁中有锁）
当程序中多个地方用到锁的时候，要使用递归锁: RLock()互斥锁(Mutex)：一个进程下可以启动多个线程，多个线程共享父进程的内存空间，也就意味着每个线程可以访问同一份数据，此时，

如果2个线程同时修改同一份数据就会出现问题，这时候就要使用互斥锁以保证数据在操作时候是加锁的其他线程无法修改。

信号量(Semaphore)
互斥锁同时只允许一个线程更改数据，而信号量是同时允许一定数量的线程更改数据。
功能：就是用来控制同时运行的线程数量
比如；我们启动100个线程，通过信号量可以控制同一时刻有几个线程运行。

举例：

 import threading

 def fun(n):

     semaph.acquire() #加锁

     print(n)

     time.sleep(2)

     semaph.release() #解锁

 semaph = threading.BoundedSemaphore(5) # 定义同时有5个线程运行

 for i in range(23):

     t = threading.Thread(target=fun,args=(i,))

     t.start()

events 事件
通过设置的标志位实现2个或多个线程间的交互
event = threading.Event()
event.wait() 等待设定标志位
event.set() 设定标志位
event.clear() 清空标志位
event.is_set() 判断是否设定标志位

举例：红绿灯

 import threading

 event = threading.Event()

 def light(): # 定义一个红绿灯（也就是一个规则）

     count = 0 # 默认0秒

     event.set() # 首先设置开始默认标志位（绿灯）

     while True:

         if count > 5 and count < 10:

             print('\033[31;1m当前是红灯，所有车停止等待\033[0m')

             event.clear() # 当满足条件清空标志位（红灯）

         elif count > 10:

             print('变灯了')

             event.set() # 进行设置标志位

             count = 0  # 重新计数

         else:

             print('\033[32;1m当前是绿灯，所有车可以经过\033[0m')

         count += 1

         time.sleep(1)

 def car(arg):

     while True:

        # 通过判断标志为执行代码

         if event.is_set(): # 判断如果设置了标志位，则执行

             print('汽车:%s 可以通行' % arg)

             time.sleep(1)

         else:

             print('红灯了。汽车要停车')

             event.wait()  # 没有设置标志位，则进入等待

             print('变灯了，可以开车')

 lit = threading.Thread(target=light)  # 启动灯

 lit.start()

 ca = threading.Thread(target=car,args=('雪铁龙',)) # 启动车

 ca.start()

queue 队列：类似于一条管道，只应用于当前进程内的线程相互数据访问使用，跳出当前进程就会失效。
注意：队列都是在内存中操作，进程退出，队列清空，另队列也是一个阻塞的形态。
功能：解耦，提高效率

常用方法：
queue.Queue(maxsize=0) :先入先出
queue.LifoQueue(maxsize=0): 后进先出
queue.PriorityQueue(maxsize=0)：存储数据时可设置优先级的队列（元组格式：优先级，数据）
queue.deque 双线队列
队列的方法
put：放数据,Queue.put（）默认有block=True和timeout两个参数。当block=True时，写入是阻塞式的，阻塞时间由timeout确定。当队列q被（其他线程）写满后，这段代码就会阻塞，直至其他线程取走数据。Queue.put（）方法加上 block=False 的参数，即可解决这个隐蔽的问题。但要注意，非阻塞方式写队列，当队列满时会抛出 exception Queue.Full 的异常
get：取数据(默认阻塞),Queue.get([block[, timeout]])获取队列，timeout等待时间
empty：如果队列为空，返回True，否则返回False
qsize：显示队列中真实存在的元素长度
maxsize：最大支持的队列长度，使用时无括号
join：实际上意味着等到队列为空，再执行别的操作
task_done：在完成一项工作之后，Queue.task_done()函数向任务已经完成的队列发送一个信号
full：如果队列满了，返回True

举例：先入先出

 import queue

 q = queue.Queue(5) #如果不设置长度，默认为无限长

 print(q.maxsize)  # 打印最大长度

 q.put('a')

 q.put('b')

 q.put('c')

 print(q.qsize())  # 打印队列元素长度

 print(q.get())

 print(q.get())

举例：后进先出

 import queue

 q = queue.LifoQueue()

 q.put('a')

 q.put('b')

 print(q.get())

 打印：b

举例：优先级队列
需要注意的是,优先级队列put的是一个元组,格式为：(优先级,数据),优先级数越小,级别越高

 import queue

 q = queue.PriorityQueue()

 q.put((2,'a'))

 q.put((1,'b'))

 q.put((3,'c'))

 print(q.get())

 print(q.get())

 print(q.get())

 输出为：

 (1, 'b')

 (2, 'a')

 (3, 'c')

生产者消费者模型

在工作中，大家可能会碰到这样一种情况：某个模块负责产生数据，这些数据由另一个模块来负责处理（此处的模块是广义的，可以是类、函数、线程、进程等）。
产生数据的模块，就形象地称为生产者；而处理数据的模块，就称为消费者。在生产者与消费者之间在加个缓冲区，我们形象的称之为仓库，
生产者负责往仓库了进商品，而消费者负责从仓库里拿商品，这就构成了生产者消费者模型。结构如下：
生产者 --》缓存区 --》消费者
优点：
1：解耦：假设生产者和消费者分别是两个类。如果让生产者直接调用消费者的某个方法，那么生产者对于消费者就会产生依赖（也就是耦合）。
如果两者都依赖于某个缓冲区，两者之间不直接依赖，耦合也就相应降低了。
2：支持并发：由于生产者与消费者是两个独立的并发体，他们之间是用缓冲区作为桥梁连接，生产者只需要往缓冲区里丢数据，
就可以继续生产下一个数据，而消费者只需要从缓冲区了拿数据即可，这样就不会因为彼此的处理速度而发生阻塞。
3：支持忙闲不均：缓冲区还有另一个好处。如果制造数据的速度时快时慢，缓冲区的好处就体现出来了。当数据制造快的时候，
消费者来不及处理，未处理的数据可以暂时存在缓冲区中。等生产者的制造速度慢下来，消费者再慢慢处理掉

举例：利用线程队列技术吃包子

 import queue,time,threading

 q = queue.Queue(10) # 默认定义最大队列长度为10

 def P(name):

     while True:

         if q.qsize() <= 5:  # 当队列中长度小于等于5时候，开始生产包子

             print('目前剩余%d个包子，不足5个，开始生产，保持随时有10个包子出售' % (q.qsize()))

             for i in range(10):

                 baozi = '%s开始生产包子，生产了%d个包子' % (name,i)

                 print(baozi)

                 q.put(i)  # 添加

         else:

             print('当前剩余包子数量：%d个，先不生产' % (q.qsize()))

             time.sleep(2)

 def C(name):

     while True:

         if q.qsize() > 5: # 当队列长度大于5，开始买包子

             for l in name:

                 print('%s 来了，买5个包子' % l)

                 for i in range(5):

                     print('交给%s %d个包子' % (l,i))

                     q.get()

                 print('5个包子已交给%s' % l)

         else:

             print('包子不够，等待生产包子')

             time.sleep(1)

 P1 = threading.Thread(target=P,args=('jack chen',)) # 并发线程的生产者

 P1.start() # 启动生产者

 C1 = threading.Thread(target=C,args=(['bard','vivi','anne'],)) # 并发线程的消费者

 C1.start()  # 启动消费者

---------------------------以上为线程功能

举例：进程和线程共存

 import multiprocessing,time,threading

 def thread_fun():

     print('当前线程ID:%d' % threading.get_ident())

 def fun(n):

     time.sleep(2)

     print(n)

     # 线程启动

     t = threading.Thread(target=thread_fun)

     t.start()

 if __name__ == '__main__':

     for i in range(10):

         # 进程启动

         pro = multiprocessing.Process(target=fun,args=('进程并发:%d' % i,))

         pro.start()

进程间数据交互解释：进程内存各自独立，如何进行数据交互了。找中间件，有3种方法：（进程队列，管道，Managers数据共享）
举例1：实现数据传递（进程队列）

from multiprocessing import Queue,Process

def fun(qq):

    # 这里的参数qq是启动进程时候传入的队列

    qq.put(['jack','bard','vivi'])

if __name__ == '__main__':

    q = Queue()  # 实例化进程队列

    P = Process(target=fun,args=(q,)) # 将队列传入子进程

    P.start()

    print(q.get()) # 打印队列数据

    P.join()

第二种实现进程间数据传输方法：Pipes (管道)

举例2：实现数据传递（socket技术）

 from multiprocessing import Process,Pipe

 def fun(conn):

     conn.send(['jack','bard','vivi'])

     conn.send(['jack1','bard1','vivi1'])

     print(conn.recv())

 if __name__ == '__main__':

     # 这里pipe管道有2个头，一头定义变量person，另一头定义变量child

     person,child = Pipe()

     # 将child传给子进程fun函数，进行数据的传递

     P = Process(target=fun,args=(child,))

     P.start()

     # 这里主进程使用person打印子进程发来的数据

     print(person.recv())

     print(person.recv())

     # 主进程也可以发送数据给子进程

     person.send('父进程发消息给子进程')

     P.join()

第三种：Managers 可以实现2个进程间数据共享，并可以修改共享数据

举例3：实现数据传递（Managers）

 from multiprocessing import Process,Manager

 import os

 def manag(d,l): # 这个子进程函数功能实现修改共享数据

     d[os.getpid()] = os.getpid()

     l.append(os.getpid())

 def out(d,l): # 这个子进程函数功能实现提取打印共享数据

     print(d)

     for line in l:

         print(line)

 if __name__ == '__main__':

     manager = Manager()

     d = manager.dict() # 生成一个字典，可实现在多个进程间共享和传递数据

     l = manager.list(range(5)) # 生成一个列表，可实现在多个进程间共享和传递数据

     id_list = [] # 临时存放进程内存地址

     for i in range(10):

         # 先执行manag函数进行数据的添加修改

         P = Process(target=manag,args=(d,l,))

         P.start()

         id_list.append(P)

     for res in id_list:

         res.join()

     print(d)

     print(l)

     # 再调用out函数对数据进行打印输出

     P1 = Process(target=out,args=(d,l)) # 再将字典，列表传入另一个子进程，实现数据共享和传递

     P1.start()

     P1.join()

进程锁：就是防止多个进程打印数据时候同时抢占屏幕，导致混乱输出。

举例：

from multiprocessing import Process,Lock

def fun(lk,mess):

    lk.acquire()  # 加锁

    print('输出:',mess)  # 屏幕输出

    lk.release()  # 解锁

if __name__ == '__main__':

    lock = Lock()

    for i in range(20):

        P = Process(target=fun,args=(lock,i))

        P.start()

进程池
进程池内部维护一个进程序列，当使用时，则去进程池中获取一个进程，如果进程池序列中没有可供使用的进程，那么程序就会等待，直到进程池中有可用进程为止，
进程池的2个方法：
1：apply （同步，串行）
2：apply_async （异步，并行）

举例：

 from multiprocessing import Process,Pool

 import os,time

 def fun(i):

     time.sleep(2)

     print(i+100)

 def bar(i):

     print('finish:%s' % (str(os.getppid())))

 if __name__ == '__main__':

     pool = Pool(processes=5)  # 允许进程池同时放入5个进程

     for i in range(10): # 启动10个进程

         # out = pool.apply(func=fun,args=(i,)) # 串行写法

         # pool.apply_async(func=fun,args=(i,)) # 并行写法

         pool.apply_async(func=fun,args=(i,),callback=bar) # 并行,callback表示执行完子进程的fun函数后，再由主进程再执行bar函数收尾

     print('end')

     pool.close() # 注意这里 close,join的顺序是固定了。不能变动

     pool.join() # 注意顺序，必须有，进程池中的进程执行完毕后，再关闭

python学习之-- 进程和线程的更多相关文章

Python学习--17 进程和线程
线程是最小的执行单元,而进程由至少一个线程组成.如何调度进程和线程,完全由操作系统决定,程序自己不能决定什么时候执行,执行多长时间. 进程 fork调用通过fork()系统调用,就可以生成一个子进程 ...
Python学习--18 进程和线程
线程是最小的执行单元,而进程由至少一个线程组成.如何调度进程和线程,完全由操作系统决定,程序自己不能决定什么时候执行,执行多长时间. 进程 fork调用通过fork()系统调用,就可以生成一个子进程 ...
day34 python学习守护进程，线程，互斥锁，信号量，生产者消费者模型，
六守护线程无论是进程还是线程,都遵循:守护xxx会等待主xxx运行完毕后被销毁需要强调的是:运行完毕并非终止运行 #1.对主进程来说,运行完毕指的是主进程代码运行完毕 #2.对主线程来说,运行完 ...
python学习(十三)进程和线程
python多进程 from multiprocessing import Process import os def processFunc(name): print("child pro ...
python中的进程、线程（threading、multiprocessing、Queue、subprocess）
Python中的进程与线程学习知识,我们不但要知其然,还是知其所以然.你做到了你就比别人NB. 我们先了解一下什么是进程和线程. 进程与线程的历史我们都知道计算机是由硬件和软件组成的.硬件中的CP ...
Python学习day38-并发编程(线程)
figure:last-child { margin-bottom: 0.5rem; } #write ol, #write ul { position: relative; } img { max- ...
VC++学习之进程和线程的区别
VC++学习之进程和线程的区别一.进程进程是表示资源分配的基本单位,又是调度运行的基本单位.例如,用户运行自己的程序,系统就创建一个进程,并为它分配资源,包括各种表格.内存空间.磁盘 ...
JUC学习笔记——进程与线程
JUC学习笔记--进程与线程在本系列内容中我们会对JUC做一个系统的学习,本片将会介绍JUC的进程与线程部分我们会分为以下几部分进行介绍: 进程与线程并发与并行同步与异步线程详解进程与线程 ...
Python 中的进程、线程、协程、同步、异步、回调
进程和线程究竟是什么东西?传统网络服务模型是如何工作的?协程和线程的关系和区别有哪些?IO过程在什么时间发生? 一.上下文切换技术简述在进一步之前,让我们先回顾一下各种上下文切换技术. 不过首先说 ...

随机推荐

在项目中运用精益 - Five Why
今天成功地运用了5个why对一个项目上的问题进行剖析,收获良多,在此分享给大家. 事情是这样的,该项目是个固定价格项目,处于收尾阶段,客户提出来了一些需求,我们(实施方)认为这些要求是不在最初项目范围 ...
ubuntu下安装php-curl扩展
查找包 apt-cache是linux下的一个apt软件包管理工具,它可查询apt的二进制软件包缓存文件.APT包管理的大多数信息查询功能都可以由apt-cache命令实现,通过apt-cache命令 ...
TFS2010单独安装配置tfs build server
记录一下确实很磨人. 同样硬件和软件环境的两台服务器,其中一台服务器很久之前就配置好了tfs2010 build ,然后最近想再配置一台tfs build server,但是按照以前的配置流程始终提示 ...
Navicat工具备份还原mysql数据库详细图解
Navicat是个很不错的MYSQL数据库管理工具,我们常用的还web形式的phpmyadmin和font这三种了,都是非常不错的mysql管理工具.因为Navicat工具兼容性比较好,操作也比较简单 ...
（转）编码剖析Spring装配基本属性的原理
http://blog.csdn.net/yerenyuan_pku/article/details/52856465 上回我们已经讲到了Spring依赖注入的第一种方式,现在我们来详解第二种方式,须 ...
Android（java）学习笔记158：多线程断点下载的原理（JavaSE实现）
1. 为什么需要多线程下载? 服务器的资源有限,同时的平均地分配给每个客户端.开启的线程越多抢占的服务的资源就越多,下载的速度就越块. 2. 下载速度的限制条件? (1)你的电脑手机宽带的带宽 ...
字符串类型：str, bytes 的区别
Python 3最重要的新特性之一是对字符串和二进制数据流做了明确的区分. 文本总是 Unicode,由 str 类型表示, 二进制数据则由 bytes 类型表示. Python 3不会以任意隐式的方 ...
[LUOGU] [NOIP2017] P3960 列队
题目描述 Sylvia 是一个热爱学习的女孩子. 前段时间,Sylvia 参加了学校的军训.众所周知,军训的时候需要站方阵. Sylvia 所在的方阵中有 n \times mn×m 名学生,方阵的行 ...
phpstorm使用Database关联数据库
1.如图选择mysql 配置数据库连接及shh 点击Test Connection,如果成功,即可点击ok连接mysql数据库 2.如图选择所有的表 3.更新数据
php中session和cookie的使用及区别
1.cookie的使用什么是 Cookie? cookie 常用于识别用户.cookie 是服务器留在用户计算机中的小文件.每当相同的计算机通过浏览器请求页面时,它同时会发送 cookie.通过 P ...

python学习之-- 进程 和 线程

python学习之-- 进程 和 线程的更多相关文章

随机推荐

热门专题

python学习之-- 进程和线程

python学习之-- 进程和线程的更多相关文章