python GIL全局解释器锁,多线程多进程效率比较,进程池,协程,TCP服务端实现协程

GIL全局解释器锁

'''

python解释器:

    - Cpython C语言

    - Jpython  java

    ...

1、GIL: 全局解释器锁

    - 翻译: 在同一个进程下开启的多线程，同一时刻只能有一个线程执行，因为Cpython的内存管理不是线程安全。

    - GIL全局解释器锁，本质上就是一把互斥锁，保证数据安全。

定义：

In CPython, the global interpreter lock, or GIL, is a mutex that prevents multiple

native threads from executing Python bytecodes at once. This lock is necessary mainly

because CPython’s memory management is not thread-safe. (However, since the GIL

exists, other features have grown to depend on the guarantees that it enforces.)

结论：在Cpython解释器中，同一个进程下开启的多线程，同一时刻只能有一个线程执行，无法利用多核优势。

# 为什么要有全局解释器锁：

    - 没有锁:

2、GIL全局解释器锁的优缺点:

    1.优点:

        保证数据的安全

    2.缺点:

        单个进程下，开启多个线程，牺牲执行效率，无法实现并行，只能实现并发。

        - IO密集型， 多线程

        - 计算密集型，多进程

'''

import time

from threading import Thread

n = 100

def task():

    global n

    m = n

    time.sleep(3)   #遇到IO,保存状态+切换，其他线程继续争抢GIL

    n = m-1

if __name__ == '__main__':

    list1 = []

    for line in range(10):

        t = Thread(target=task)

        t.start()

        list1.append(t)

    for t in list1:

        t.join()

    print(n)    #

多线程多进程效率比较

单核情况下都用多线程效率高

'''

IO密集型下使用多线程.

计算密集型下使用多进程.

IO密集型任务，每个任务4s

    - 单核:

        - 开启线程比进程节省资源。

    - 多核:

        - 多线程:

            - 开启4个子线程: 16s 

        - 多进程:

            - 开启4个进程: 16s + 申请开启资源消耗的时间  

计算密集型任务，每个任务4s

    - 单核:

        - 开启线程比进程节省资源。

    - 多核:

        - 多线程:

            - 开启4个子线程: 16s

        - 多进程:

            - 开启多个进程: 4s

计算密集型: 多进程

    假设100份原材料同时到达工厂，聘请100个人同时制造，效率最高

IO密集型： 多线程

    假设100份原材料，只有40份了，其他还在路上，聘请40个人同时制造。

'''

from threading import Thread

from multiprocessing import Process

import time

# 计算密集型任务

def task1():

    # 计算1000000次 += 1

    i = 10

    for line in range(10000000):

        i += 1

# IO密集型任务

def task2():

    time.sleep(3)

if __name__ == '__main__':

    # 1、测试多进程:

    # 测试计算密集型

    # start_time = time.time()

    # list1 = []

    # for line in range(6):

    #     p = Process(target=task1)

    #     p.start()

    #     list1.append(p)

    #

    # for p in list1:

    #     p.join()

    # end_time = time.time()

    # # 消耗时间: 4.204240560531616

    # print(f'计算密集型消耗时间: {end_time - start_time}')

    #

    # # 测试IO密集型

    # start_time = time.time()

    # list1 = []

    # for line in range(6):

    #     p = Process(target=task2)

    #     p.start()

    #     list1.append(p)

    #

    # for p in list1:

    #     p.join()

    # end_time = time.time()

    # # 消耗时间: 4.382250785827637

    # print(f'IO密集型消耗时间: {end_time - start_time}')

    # 2、测试多线程:

    # 测试计算密集型

    start_time = time.time()

    list1 = []

    for line in range(6):

        p = Thread(target=task1)

        p.start()

        list1.append(p)

    for p in list1:

        p.join()

    end_time = time.time()

    # 消耗时间: 5.737328052520752

    print(f'计算密集型消耗时间: {end_time - start_time}')

    # 测试IO密集型

    start_time = time.time()

    list1 = []

    for line in range(6):

        p = Thread(target=task2)

        p.start()

        list1.append(p)

    for p in list1:

        p.join()

    end_time = time.time()

    # 消耗时间: 3.004171848297119

    print(f'IO密集型消耗时间: {end_time - start_time}')

进程池

# 线程池

from concurrent.futures import ProcessPoolExecutor

import time

# 池子对象: 内部可以帮你提交50个启动进程的任务

p_pool = ProcessPoolExecutor(50)

def task1(n):

    print(f'from task1...{n}')

    time.sleep(10)

if __name__ == '__main__':

    n = 1

    while True:

        # 参数1: 函数名

        # 参数2: 函数的参数1

        # 参数3: 函数的参数2

        # submit(参数1, 参数2, 参数3)

        p_pool.submit(task1, n)

        n += 1

wait方法可以让主线程阻塞，直到满足设定的要求。

from concurrent.futures import ThreadPoolExecutor, wait, ALL_COMPLETED, FIRST_COMPLETED

import time

# 参数times用来模拟网络请求的时间

def get_html(times):

    time.sleep(times)

    print("get page {}s finished".format(times))

    return times

executor = ThreadPoolExecutor(max_workers=2)

urls = [3, 2, 4] # 并不是真的url

all_task = [executor.submit(get_html, (url)) for url in urls]

wait(all_task, return_when=ALL_COMPLETED)

print("main")

# 执行结果

# get page 2s finished

# get page 3s finished

# get page 4s finished

# main

wait方法接收3个参数，等待的任务序列、超时时间以及等待条件。等待条件return_when默认为ALL_COMPLETED，表明要等待所有的任务都结束。可以看到运行结果中，确实是所有任务都完成了，主线程才打印出main。等待条件还可以设置为FIRST_COMPLETED，表示第一个任务完成就停止等待。

用线程池爬取梨视频

# 线程池测试

############

# 2 爬取视频

#############

# 先查看ajax的调用路径 https://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=9&start=0

#categoryId=9 分类id

#start=0 从哪个位置开始，每次加载12个

# https://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=9&start=0

from concurrent.futures import ThreadPoolExecutor,wait,ALL_COMPLETED

import requests

import re

import time

start = time.time()

pool = ThreadPoolExecutor(10)

ret = requests.get('https://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=1&start=0')

# print(ret.text)

# 正则解析

reg = '<a href="(.*?)" class="vervideo-lilink actplay">'

video_urls=re.findall(reg,ret.text)

# print(video_urls)

def download(url):

    ret_detail = requests.get('https://www.pearvideo.com/' + url)   # 相当于文件句柄，建立连接，流的方式，不是一次性取出

    # print(ret_detail.text)

    # 正则去解析

    reg = 'srcUrl="(.*?)",vdoUrl=sr'    # 正则表达式匹配式

    mp4_url = re.findall(reg, ret_detail.text)[0]  # type:str

    # 下载视频

    video_content = requests.get(mp4_url)

    video_name = mp4_url.rsplit('/', 1)[-1]

    with open(video_name, 'wb')as f:

        for line in video_content.iter_content():

            f.write(line)

threads=[]

for url in video_urls:

    t = pool.submit(download(url),url)

    threads.append(t)

wait(threads, return_when=ALL_COMPLETED)    # 等待线程池全部完成

end = time.time()

print('time:',end-start)    # 计算时间

线程池其他方法可以参考： https://www.jianshu.com/p/b9b3d66aa0be

协程（理论 + 代码）

1.什么是协程？
　　- 进程: 资源单位
　　- 线程: 执行单位
　　- 协程: 单线程下实现并发
　　　　- 在IO密集型的情况下，使用协程能提高最高效率。

　　　　注意: 协程不是任何单位，只是一个程序员YY出来的东西。

　　　　Nignx
　　　　500 ----> 500 ---> 250000 ---> 250000 ----> 10 ----> 2500000
　　　　总结: 多进程 ---》多线程 ---》让每一个线程都实现协程.(单线程下实现并发)

　　　　- 协程的目的:
　　　　　　- 手动实现 "遇到IO切换 + 保存状态" 去欺骗操作系统，让操作系统误以为没有IO操作，将CPU的执行权限给你。

from gevent import monkey  # 猴子补丁

monkey.patch_all()  # 监听所有的任务是否有IO操作

from gevent import spawn  # spawn(任务)

from gevent import joinall

import time

def task1():

    print('start from task1...')

    time.sleep(1)

    print('end from task1...')

def task2():

    print('start from task2...')

    time.sleep(3)

    print('end from task2...')

def task3():

    print('start from task3...')

    time.sleep(5)

    print('end from task3...')

if __name__ == '__main__':

    start_time = time.time()

    sp1 = spawn(task1)

    sp2 = spawn(task2)

    sp3 = spawn(task3)

    # sp1.start()

    # sp2.start()

    # sp3.start()

    # sp1.join()

    # sp2.join()

    # sp3.join()

    joinall([sp1, sp2, sp3])

    end_time = time.time()

    print(f'消耗时间: {end_time - start_time}')

TCP服务端实现协程

# server

from gevent import monkey; monkey.patch_all()

from gevent import spawn

import socket

server = socket.socket()

server.bind(

    ('127.0.0.1', 9999)

)

server.listen(5)

# 与客户端通信

def working(conn):

    while True:

        try:

            data = conn.recv(1024)

            if len(data) == 0:

                break

            print(data.decode('utf-8'))

            conn.send(data.upper())

        except Exception as e:

            print(e)

            break

    conn.close()

# 与客户端连接

def run(server):

    while True:

        conn, addr = server.accept()

        print(addr)

        spawn(working, conn)

if __name__ == '__main__':

    print('服务端已启动...')

    g = spawn(run, server)

    g.join()

#client

from threading import Thread, current_thread

import socket

def send_get_msg():

    client = socket.socket()

    client.connect(

        ('127.0.0.1', 9999)

    )

    while True:

        client.send(f'{current_thread().name}'.encode('utf-8'))

        data = client.recv(1024)

        print(data.decode('utf-8'))

# 模拟100个用户访问服务端

if __name__ == '__main__':

    list1 = []

    for line in range(100):

        t = Thread(target=send_get_msg)

        t.start()

        list1.append(t)

    for t in list1:

        t.join()

python GIL全局解释器锁,多线程多进程效率比较,进程池,协程,TCP服务端实现协程的更多相关文章

Python自动化【第九篇】：Python基础-线程、进程及python GIL全局解释器锁
本节内容: 进程与线程区别线程 a) 语法 b) join c) 线程锁之Lock\Rlock\信号量 d) 将线程变为守护进程 e) Event事件 f) queue队列 g) 生 ...
[py]GIL(全局解释器锁):多线程模式
在多线程时同一时刻只允许一个线程来访问CPU,直到解释器遇到I/O操作或者操作次数达到一定数目时才会释放GIL 参考 Python虽然不能利用多线程实现多核任务,但可以通过多进程实现多核任务.多个P ...
python GIL全局解释器锁与互斥锁目录
python 并发编程多线程 GIL全局解释器锁基本概念 python 并发编程多线程 GIL与Lock python 并发编程多线程 GIL与多线程
Python GIL全局解释器锁
'''在python原始解释器Cpython中存在GIL(Global Interpreter Lock,全局解释器锁),因此在执行Python代码时,会产生互斥锁来限制线程对共享资源的访问,指导接 ...
Python之路-python(paramiko，进程和线程的区别，GIL全局解释器锁，线程)
一.paramiko 二.进程.与线程区别三.python GIL全局解释器锁四.线程语法 join 线程锁之Lock\Rlock\信号量将线程变为守护进程 Event事件 queue队列生 ...
【转】进程、线程、 GIL全局解释器锁知识点整理
转自:https://www.cnblogs.com/alex3714/articles/5230609.html 本节内容操作系统发展史介绍进程.与线程区别 python GIL全局解释器锁线 ...
[Python 多线程] GIL全局解释器锁 (十三)
Queue 标准库queue模块,提供FIFO(先进先出)的Queue.LIFO(后进先出)的队列.优先队列. Queue类是线程安全的,适用于多线程间安全的交换数据.内部使用了Lock和Condit ...
python并发编程-多线程实现服务端并发-GIL全局解释器锁-验证python多线程是否有用-死锁-递归锁-信号量-Event事件-线程结合队列-03
目录结合多线程实现服务端并发(不用socketserver模块) 服务端代码客户端代码 CIL全局解释器锁****** 可能被问到的两个判断与普通互斥锁的区别验证python的多线程是否有用需 ...
python 并发编程多线程 GIL全局解释器锁基本概念
首先需要明确的一点是GIL并不是Python的特性,它是在实现Python解析器(CPython)时所引入的一个概念. 就好比C++是一套语言(语法)标准,但是可以用不同的编译器来编译成可执行代码. ...

随机推荐

Jike_Time-决策树
根节点非叶子节点(决策点) 叶子节点(决策结果) 分支熵代表混乱程度信息增益构造树的基本想法是随着树深度的增加.节点的熵迅速地降低.熵降低的速度越快越好,这样我们有望得到一颗高度最矮的决策树 ...
.NET CORE下最快比较两个文件内容是否相同的方法
本文因为未考虑磁盘缓存, 结果不是很准确, 更严谨的结果请参看本博文的续集最近项目有个需求,需要比较两个任意大小文件的内容是否相同,要求如下: 项目是.NET CORE,所以使用C#进行编写比较方法 ...
Asp.Net Core AsyncLocal 异步上下文
引子阅读以下代码,并尝试分析代码解析在主线程中,线程Id为1,为线程变量赋值变量==d6ff 开启一个新的task,此时线程Id为4,变量==d6ff,并调用Task1 开启一个同步Task3 ...
Dockerfile命令整理
通过Dockerfile只做Docker镜像时,需要用到Dockerfile的命令,收集整理如下,以便后续翻阅参考. FROM 功能为指定基础镜像,并且必须是第一条指令. 如果不以任何镜像为基础,那么 ...
ZooKeeper 入门看这篇就够了
什么是 ZooKeeper? ZooKeeper 是一个分布式的,开放源码的分布式应用程序协同服务.ZooKeeper 的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来,构成一个高效可靠的原 ...
python-1-基础认识
前言将近2020年,python2即将不再更新,但是我们现在的python3也能非常受欢迎的!回顾一下2/3的区别: 1.python2 源码不标准,混乱,重复代码太多, 2.python3 统一 ...
JSP页面的注释细节
业务场景:通过后台传参,jstl标签控制一个页签是否显示,不过现在要去掉判断,直接让页签显示在sublime直接这样注释,然后刷新,一直找不到标签显示,其它的都是正常的 <!--<c:i ...
CodeForce 359C Prime Number
Prime Number CodeForces - 359C Simon has a prime number x and an array of non-negative integers a1, ...
HDU-1760 A New Tetris Game DFS
曾经,Lele和他姐姐最喜欢,玩得最久的游戏就是俄罗斯方块(Tetris)了. 渐渐得,Lele发觉,玩这个游戏只需要手快而已,几乎不用经过大脑思考. 所以,Lele想出一个新的玩法. Lele和姐姐 ...
.NET Core 2.1 以下的控制台应用程序生成 EXE，且使用命令行参数动态运行控制器应用程序的示例
文章: https://stackoverflow.com/questions/44038847/vs2017-compile-netcoreapp-as-exe 引用 <ItemGroup&g ...

python GIL全局解释器锁,多线程多进程效率比较,进程池,协程,TCP服务端实现协程

python GIL全局解释器锁,多线程多进程效率比较,进程池,协程,TCP服务端实现协程的更多相关文章

随机推荐

热门专题