CIL锁,GIL与线程池的区别,进程池和线程池,同步与异步

一.GIL锁

什么是GIL? 全局解释器锁,是加在解释器上的互斥锁

GC是python自带的内存管理机制,GC的工作原理:python中的内存管理使用的是应用计数,每个数会被加上一个整型的计数器,表示这个数据被引用的次数,当这个整数变为0时则表示该数据已经没有人使用,成为了垃圾数据,当内存占用达到某个阈值,GC会将其他线程挂起,然后执行垃圾清理操作,垃圾清理也是一串代码,也就需要一条线程来执行.

为什么需要GIL?

由于CPython的内存管理机制是非线程安全,于是CPython就给解释器加了一个锁,解决了安全问题,但是降低了效率,另外,虽然有解决方案,但是由于牵涉太多,一旦修改则很多基于GIL的程序都需要修改,所以变成了历史遗留问题.

GIL加锁,解锁的时机?

加锁时机:在调用解释器时立即加锁

解锁时机:①当前线程遇到IO时释放 ②当前线程执行时间超过设定值时释放,解释器会检测线程的执行时间,一旦到达某个阈值,通知线程保存状态切换线程.

GIL带来的问题:即使是多核处理器下也无法真正的并行.

总结:

①在单核情况下,无论是IO密集型还是计算密集型,GIL都不会产生影响,而多线程开销小,并且节约资源,所以使用多线程.

②在多核情况下,IO密集型会受到GIL的影响,但是很明显IO速度远比计算速度慢,所以两者执行的时间差不多,基本可以忽略不计,而在这个情况下我们考虑到多线程开销小,并且节约资源,所以多核情况下,IO密集型我们使用多线程.

③对于计算密集型,在多核情况下,CPython中多线程是无法并行的,为了解决这一弊端,Python推出了多进程技术,可以良好的利用多核处理器来完成计算的任务.

多线程用于IO密集型，如socket，爬虫，web

多进程用于计算密集型，如金融分析

多进程与多线程效率对比:

现在的电脑都是多核系统

#多进程解决计算密集型

from multiprocessing import Process

import time

a = 10

def task():

    for i in range(10000000):

        global a

        a +=1

        a*10/2-3

if __name__ == '__main__':

    start = time.time()

    ps = []

    for i in range(3):

        p = Process(target=task)

        p.start()

        ps.append(p)

    for p in ps:

        p.join()

    print(time.time()-start)

结果:5.455920934677124

#多线程解决计算密集型

from threading import Thread

import time

a = 10

def task():

    for i in range(10000000):

        global a

        a +=1

        a*10/2-3

if __name__ == '__main__':

    start = time.time()

    ts = []

    for i in range(3):

        t = Thread(target=task)

        t.start()

        ts.append(t)

    for t in ts:

        t.join()

    print(time.time()-start)

结果:8.375339031219482

#多进程解决IO密集型

from multiprocessing import Process

import time

def task():

    path =r'E:\python试学视频\day27、28选课系统\11 测试程序2.mp4'

    with open(path,mode='rb') as f:

        while True:

            data = f.read(1024)

            if not data:

                break

if __name__ == '__main__':

    start = time.time()

    ps = []

    for i in range(3):

        p = Process(target=task)

        p.start()

        ps.append(p)

    for p in ps:

        p.join()

    print(time.time()-start)

结果:0.3124856948852539

#多线程解决IO密集型

from threading import Thread

import time

a = 10

def task():

    path =r'E:\python试学视频\day27、28选课系统\11 测试程序2.mp4'

    with open(path,mode='rb') as f:

        while True:

            data = f.read(1024)

            if not data:

                break

if __name__ == '__main__':

    start = time.time()

    ts = []

    for i in range(3):

        t = Thread(target=task)

        t.start()

        ts.append(t)

    for t in ts:

        t.join()

    print(time.time()-start)

结果:0.1250016689300537

二.GIL锁与自定义锁的区别

GIL是用于保护解释器相关的数据,解释器也是一段程序,肯定有其定义的各种数据

GIL并不能保证自己定义的数据的安全,所以当程序中出现多线程共享数据的时候就需要自定义加锁.

三.线程池与进程池

什么是进程池/线程池?

池表示是一个容器,本质就是一个存储进程或线程的列表

IO密集型使用线程池,计算密集型使用进程池

为什么需要线程池/进程池?

很多情况下需要控制进程或者线程在一个合理的范围内,线程/进程池不仅帮我们控制线程/进程的数量，还帮我们完成了线程/进程的创建，销毁，以及任务的分配

线程池的使用:

from concurrent.futures import ThreadPoolExecutor

from threading import current_thread,active_count

import time

#创建线程池,指定最大线程数为3 如果不指定 默认为cpu核心数*5

pool = ThreadPoolExecutor(3) #不会立即开启子线程

def task():

    print('%s running..'%current_thread().name)

    print(active_count())

    time.sleep(2)

#提交任务到线程池

for i in range(10):

    pool.submit(task)

进程池的使用:

from concurrent.futures import ProcessPoolExecutor

import time,os

#创建进程池,最大进程数为3,默认为cpu个数

pool = ProcessPoolExecutor(3)#不会立即开启子进程

def task():

    print('%s running..'%os.getpid())

    time.sleep(2)

if __name__ == '__main__':

    #提交任务到进程池

    for i in range(10):

        pool.submit(task)

        #第一次提交任务时会创建进程后续提交任务直接交给已经存在的进程来完成,如果没有空闲进程就等待

结果:

1464 running..

11732 running..

8236 running..

1464 running..

11732 running..

8236 running..

1464 running..

11732 running..

8236 running..

1464 running..

案例：TCP中的应用

首先要明确，TCP是IO密集型，应该使用线程池

#多线程TCP服务器

from concurrent.futures import ThreadPoolExecutor

import socket

server = socket.socket()

server.bind(('192.168.12.207',4396))

server.listen()

pool = ThreadPoolExecutor(3) #线程池,控制可以连接到服务器的客户端的个数

def task(client):

    while True:

        try:

            data = client.recv(1024)

            if not data:

                client.close()

                break

            client.send(data.upper())

        except ConnectionResetError:

            client.close()

            break

while True:

    client,addr = server.accept()

    t = pool.submit(task,client)

#多线程TCP客户端

#使用多线程是为了可以一直输入,不用等输出了才可以输入

from threading import Thread

import socket

client = socket.socket()

client.connect(('192.168.12.207',4396))

def send_msg():

    while True:

        msg = input('>>:').strip()

        if not msg:

            continue

        client.send(msg.encode('utf-8'))

send_t = Thread(target=send_msg)

send_t.start()

while True:

    try: #这个也要自定义抛出异常,如果服务器终止,客户端也会报错

        data = client.recv(1024)

        print(data.decode('utf-8'))

    except:

        client.close()

        break

与信号量的区别:

信号量也是一种锁,适用于保证同一时间能有多少个进程或线程访问

而线程池和进程池,没有对数据访问进行限制仅仅是控制数量

四.同步与异步

同步(调用/执行/任务/提交),发起任务后必须等待任务结束,拿到一个结果才能继续运行

异步发起任务后不需要关系任务的执行过程,可以继续往下运行,但还是需要结果

异步效率高于同步但是并不是所有任务都可以异步执行,判断一个任务是否可以异步的条件是,任务发起方是否立即需要执行结果

同步不等于阻塞异步不等于非阻塞当使用异步方式发起任务时任务中可能包含io操作异步也可能阻塞同步提交任务也会卡主程序但是不等同阻塞,因为任务中可能在做一些计算任务,CPU没有切换到其他程序

from concurrent.futures import ThreadPoolExecutor

import time

pool = ThreadPoolExecutor()

def task():

    time.sleep(1)

    print('sub thread run...')

for i in range(10):

    pool.submit(task) #submit是以异步的方式提交任务

print('over')

from concurrent.futures import ThreadPoolExecutor

import time

pool = ThreadPoolExecutor()

def task(i):

    time.sleep(1)

    print('sub thread run ...')

    i += 1

    return i

for i in range(10):

    f = pool.submit(task,i)

    print(f)

    print(f.result()) #result是阻塞的,会等到这个任务执行完毕才能继续执行,会将异步变为同步

print('over')

#同步又变为了异步

from concurrent.futures import ThreadPoolExecutor

import time

pool = ThreadPoolExecutor()

def task(i):

    time.sleep(1)

    print('sub thread run ...')

    i += 1

    return i

fs = []

for i in range(10):

    f = pool.submit(task,i)

    fs.append(f)

#是一个阻塞函数,会等到池子中的所有任务完成后继续执行

pool.shutdown() #里面有一个wait参数:默认值是True

#注意:shutdown之后就不能提交新任务了

for i in fs:

    print(i.result())

print('over')

CIL锁,GIL与线程池的区别,进程池和线程池,同步与异步的更多相关文章

Java进程和线程关系及区别
1.定义进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位. 线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基 ...
python笔记-10(socket提升、paramiko、线程、进程、协程、同步IO、异步IO)
一.socket提升 1.熟悉socket.socket()中的省略部分 socket.socket(AF.INET,socket.SOCK_STREAM) 2.send与recv发送大文件时对于黏包 ...
Python之路(第四十一篇)线程概念、线程背景、线程特点、threading模块、开启线程的方式
一.线程之前我们已经了解了操作系统中进程的概念,程序并不能单独运行,只有将程序装载到内存中,系统为它分配资源才能运行,而这种执行的程序就称之为进程.程序和进程的区别就在于:程序是指令的集合,它是 ...
java中的线程问题（一）什么是线程。
线程--什么是进程进程--概念要解释线程,就必须明白什么是进程. 什么是进程呢? 进程是指运行中的应用程序,每个进程都有自己独立的地址空间(内存空间),比如用户点击桌面的IE浏览器,就启动了一个进 ...
并发编程： GIL锁、GIL与互斥锁区别、进程池与线程池的区别
一.GIL 二.关于GIL性能的讨论三.计算密集测试四.IO密集测试五.GIL与互斥锁六.TCP客户端七.进程池八.进程什么时候算是空闲九.线程池一.GIL GIL Global In ...
-1-5 java 多线程概念进程线程区别联系 java创建线程方式线程组线程池概念线程安全同步同步代码块 Lock锁 sleep()和wait()方法的区别为什么wait(),notify(),notifyAll()等方法都定义在Object类中
本文关键词: java 多线程概念进程线程区别联系 java创建线程方式线程组线程池概念线程安全同步同步代码块 Lock锁 sleep()和wait()方法的区别为什么wait( ...
python 线程队列、线程池、全局解释器锁GIL
一.线程队列队列特性:取一个值少一个,只能取一次,没有值的时候会阻塞,队列满了,也会阻塞 queue队列 :使用import queue,用法与进程Queue一样 queue is especial ...
GIL全局解释器锁+GIL全局解释器锁vs互斥锁+定时器+线程queue+进程池与线程池（同步与异步）
以多线程为例写个互斥锁 from threading import Thread ,Lockimport timemutex = Lock() n = 100 def task(): global n ...
Python进阶----GIL锁,验证Cpython效率(单核,多核(计算密集型,IO密集型)),线程池,进程池
day35 一丶GIL锁什么是GIL锁: 存在Cpython解释器,全名:全局解释器锁.(解释器级别的锁) GIL是一把互斥锁,将并发运行变成串行. 在同一个进程下开启的多个线 ...

随机推荐

java基础(三) -基本数据类型
变量就是申请内存来存储值.也就是说,当创建变量的时候,需要在内存中申请空间. 内存管理系统根据变量的类型为变量分配存储空间,分配的空间只能用来储存该类型数据. 因此,通过定义不同类型的变量,可以在内存 ...
139. Word Break(动态规划)
Given a non-empty string s and a dictionary wordDict containing a list of non-empty words, determine ...
keras如何求分类问题中的准确率和召回率
https://www.zhihu.com/question/53294625 由于要用keras做一个多分类的问题,评价标准采用precision,recall,和f1_score:但是keras中 ...
连接远程数据库时出现 SSH: expected key exchange group packet from server / 2003 - Can't connect to MySQL server on 'XXX' (10038) / 1130 - Host 'XXX' is not allowed to connect to this MySQL server
昨天在自己的远程服务器上玩,把系统重装了.新装了MySQL,在本地用navicat连接的时候出了几个小问题. 问题一:SSH: expected key exchange group packet f ...
JDBC (29)
1.JDBC:就是一套API,由sun公司定义类或者定义的接口.(全称 java database connectivity:是Java访问数据库的标准规范),Java提供访问数据库规范称为JDBC, ...
Collections集合工具类的方法
addAll & shuffle: 返回类型为boolean类型,执行完操作不接收也行: 其中,静态方法,与对象无关,类名点方法名直接调用: 点点点为可变参数,随便填写几个参数都可以: sor ...
转：C# 小数位数保留的方法集锦
转载自:http://www.jb51.net/article/17010.htm 1. System.Globalization.NumberFormatInfo provider = new Sy ...
go语言，golang学习笔记1 官网下载安装，中文社区，开发工具LiteIDE
go语言,golang学习笔记1 官网下载安装,中文社区,开发工具LiteIDE Go语言是谷歌2009发布的专门针对多处理器系统应用程序的编程进行了优化,使用Go编译的程序可以媲美C或C++代码的速 ...
利用PHP将图片转换成base64编码的实现方法
先来说一下为什么我们要对图片base64编码 base64是当前网络上最为常见的传输8Bit字节代码的编码方式其中之一.base64主要不是加密,它主要的用途是把某些二进制数转成普通字符用于网络传输. ...
RHEL7 CentOS7 的 firewall命令简单介绍
firewall 服务介绍 firewall 服务是 redhat7 和 centos7 系统默认安装好的防火墙服务,一个信任级别的概念来管理与之相关联的连接与接口.它支持 ipv4 与 ipv6,并 ...

CIL锁,GIL与线程池的区别,进程池和线程池,同步与异步

CIL锁,GIL与线程池的区别,进程池和线程池,同步与异步的更多相关文章

随机推荐

热门专题