使用python进入一个熟练的状态之后就会思考提升代码的性能,尤其是python的执行效率还有很大提升空间(委婉的说法)。面对提升效率这个话题,python自身提供了很多高性能模块,很多大牛开发出了高效第三方包,可谓是百花齐放。下面根据我个人使用总结出提升性能的几个层面和相关方法。

python代码优化:

  1. 语法层面
  2. 高效模块
  3. 解释器层面

语法层面

  1. 变量定义
  2. 数据类型
  3. 条件判断
  4. 循环
  5. 生成器

变量定义

  1. 多使用局部变量少使用全局变量,命名空间中局部变量优先搜索

条件判断

  1. 可以使用字典的key value特性,直接用key命中条件,避免if判断
  2. 用in操作替换if else判断
  3. 使用any 或 all 将多个判断一起处理,减少if else的分支
  4. if条件的短路特性。if a or b这种判断中,如果a是True就不会判断b,所以将True条件写在前面可以节省判断时间。同理 and 判断将假写在前面,后面一个条件不判断

数据类型

  1. 使用dict 或set查找,替换list或tuple
  2. 集合的交并补差操作效率非常高。for循环和集合都可以处理的选择集合解决,集合的效率远高于循环

循环

  1. 用for循环代替while循环,for循环比while循环快
  2. 使用隐式for循环代替显式for循环。如sum,map,filter,reduce等都是隐式for循环。隐式循环快于显式循环
  3. 尽量不要打断循环。打断循环的放在外面。有判断条件的语句和与循环不相关的操作语句尽量放在for外面
  4. 应当将最长的循环放在最内层,最短的循环放在最外层,以减少CPU跨切循环层的次数
  5. 使用生成式替换循环创建

合理使用迭代器和生成器

需要迭代出大量数据的场景,不需要将所有数据创建出来,合理使用生成器减少内存消耗

  1. items_gen = (i for i in range(5000))
  2. >>> items_gen.__sizeof__()
  3. 96
  1. items_list = [i for i in ragne(5000)]
  2. >>> items_list.__sizeof__()
  3. 43016

高效模块

  1. collections 数据增强模块
  2. itertools 高效迭代模块
  3. array 高效数组
  4. functool 用于处理函数的高阶函数包

collections

  1. Counter: 高效的统计库
  2. defaultdict:带默认值的字典
  3. ChainMap:高效组合字典的库
  4. deque: 双端队列,高效插入删除

详细使用参见另一篇专门讲collections的文章 Python原生数据结构增强模块collections

itertools

  1. chain:多个可迭代对象构建成一个新的可迭代对象
  2. groupby:按照指定的条件分类,输出条件和符合条件的元素
  3. from_iteratorable:一个迭代对象中将所有元素类似于chain一样,统一返回
  4. islice:对迭代器进行切片,能指定start和stop以及步长

详细使用参见另一篇专门讲itertools的文章Python高性能工具迭代标准库itertools

array

array 模块是python中实现的一种高效的数组存储类型。

它和list相似,但是所有的数组成员必须是同一种类型,在创建数组的时候,就确定了数组的类型。

functool

functools.lru_cache 对函数做缓存

lru_cache 是一个装饰器,为函数提供缓存功能。被装饰的函数以相同参数调用时直接返回上一次的结果。

不做缓存

  1. import time
  2. def fibonacci(n):
  3. """斐波那契函数"""
  4. if n < 2:
  5. return n
  6. return fibonacci(n - 2) + fibonacci(n - 1)
  7. start = time.time()
  8. res = fibonacci(40)
  9. end = time.time()
  10. print(res)
  11. print(end - start)
  1. 102334155
  2. 32.14816737174988

做缓存

  1. import time
  2. from functools import lru_cache
  3. @lru_cache
  4. def fibonacci(n):
  5. """斐波那契函数"""
  6. if n < 2:
  7. return n
  8. return fibonacci(n - 2) + fibonacci(n - 1)
  9. start = time.time()
  10. res = fibonacci(40)
  11. end = time.time()
  12. print(res)
  13. print(end - start)
  1. 102334155
  2. 0.00020623207092285156

使用注意:

  1. 缓存是按照参数作为键。调用函数时任意一个参数发生变化都不会返回之前缓存结果
  2. 所有参数必须可哈希hash。也就是说参数只能是不可变对象

解释器层面:

减少python执行过程

python 代码的执行过程为:

  1. 编译器将源码编译成中间状态的字节码
  2. 解释器执行字节码,将字节码转成机器码在cpu上运行

python慢的原因主要是因为解释器。解决办法有两个:

一是解决办法是使用C/C++语言重写Python函数,但是这要求程序员对C/C++语言熟悉,且调试速度慢,不适合绝大多数Python程序员。

另外一种非常方便快捷的解决办法就是使用Just-In-Time(JIT)技术。

Just-In-Time(JIT)技术为解释语言提供了一种优化,它能克服上述效率问题,极大提升代码执行速度,同时保留Python语言的易用性。使用JIT技术时,JIT编译器将Python源代码编译成机器直接可以执行的机器语言,并可以直接在CPU等硬件上运行。这样就跳过了原来的虚拟机,执行速度几乎与用C语言编程速度并无二致。

Numba是一个针对Python的开源JIT编译器,由Anaconda公司主导开发,可以对Python原生代码进行CPU和GPU加速。

  1. import time
  2. def fun(x):
  3. total = 0
  4. start = time.time()
  5. for i in range(1,x+1):
  6. total += i
  7. end = time.time()
  8. print(total)
  9. print(end - start)
  10. fun(100000000)
  1. 5000000050000000
  2. 5.934630393981934
  1. import time
  2. from numba import jit, int32
  3. @jit(int32(int32))
  4. def fun(x):
  5. total = 0
  6. start = time.time()
  7. for i in range(1,x+1):
  8. total += i
  9. end = time.time()
  10. print(total)
  11. print(end - start)
  12. fun(100000000)
  1. 5000000050000000
  2. 0.1186532974243164

速度有60倍提升

有效提升Python代码性能的三个层面的更多相关文章

  1. Python 代码性能优化技巧(转)

    原文:Python 代码性能优化技巧 Python 代码优化常见技巧 代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构.优化. ...

  2. [转] Python 代码性能优化技巧

    选择了脚本语言就要忍受其速度,这句话在某种程度上说明了 python 作为脚本的一个不足之处,那就是执行效率和性能不够理想,特别是在 performance 较差的机器上,因此有必要进行一定的代码优化 ...

  3. Python代码性能优化技巧

    摘要:代码优化能够让程序运行更快,可以提高程序的执行效率等,对于一名软件开发人员来说,如何优化代码,从哪里入手进行优化?这些都是他们十分关心的问题.本文着重讲了如何优化Python代码,看完一定会让你 ...

  4. Python 代码性能优化技巧

    选择了脚本语言就要忍受其速度,这句话在某种程度上说明了 python 作为脚本的一个不足之处,那就是执行效率和性能不够理想,特别是在 performance 较差的机器上,因此有必要进行一定的代码优化 ...

  5. 使用 profile 进行python代码性能分析

    定位程序性能瓶颈 对代码优化的前提是需要了解性能瓶颈在什么地方,程序运行的主要时间是消耗在哪里,对于比较复杂的代码可以借助一些工具来定位,python 内置了丰富的性能分析工具,如 profile,c ...

  6. 使用line_profiler对python代码性能进行评估优化

    性能测试的意义 在做完一个python项目之后,我们经常要考虑对软件的性能进行优化.那么我们需要一个软件优化的思路,首先我们需要明确软件本身代码以及函数的瓶颈,最理想的情况就是有这样一个工具,能够将一 ...

  7. python 代码性能分析 库

    问题描述 1.Python开发的程序在使用过程中很慢,想确定下是哪段代码比较慢: 2.Python开发的程序在使用过程中占用内存很大,想确定下是哪段代码引起的: 解决方案 使用profile分析分析c ...

  8. 编写高质量的Python代码系列(三)之类与继承

    用Python进行编程时,通常需要编写心累,并定义这些类应该如何通过其接口及继承体系与外界交互.本节讲解如何使用类和继承来表达对象所以更具备的行为. 第二十二条:尽量用辅助类来维护程序的状态,而不要用 ...

  9. Python实现C代码统计工具(三)

    目录 Python实现C代码统计工具(三) 声明 一. 性能分析 1.1 分析单条语句 1.2 分析代码片段 1.3 分析整个模块 二. 制作exe Python实现C代码统计工具(三) 标签: Py ...

随机推荐

  1. ApacheCN C/C++ 译文集(二) 20211204 更新

    编写高效程序的艺术 零.序言 第一部分:性能基础 一.性能和并发性介绍 二.性能测量 三.CPU 架构.资源和性能 四.内存架构和性能 五.线程.内存和并发 第二部分:高级并发 六.并发和性能 七.并 ...

  2. 关于CALayer的疑惑

  3. element select失效问题 , vue刷新的两种方式

    changeSelect: function () { this.$forceUpdate(); }, 编辑一条记录,给select 赋值后就不动了, 原因是复制后组件需要刷新一下, 不然不能触发事件 ...

  4. SpringMVC主要组件

    1.DispatcherServlet:前端控制器,接收所有请求(如果配置/,则不包含jsp) 2.handlermapping:判断请求格式,判断希望具体要执行的那个方法 3.HanderAdapt ...

  5. linux+nginx+tomcat负载均衡,实现session同步

    第一部分:nginx反向代理tomcat 一.软件及环境 软件 系统 角色 用途 安装的软件 ip地址 Centos6.5x86_64 nginx 反向代理用户请求 nginx 172.16.249. ...

  6. MySQL语法命令之约束篇

    文章目录 1.约束概述 1.1约束的分类 1.2添加约束 2.查看表中的约束 3. `not null` 非空约束 3.1 在 `create table` 时创建 3.2 在`alter table ...

  7. idea导入mavenJar、mavenWeb项目

    两种项目都是一样的,都是maven项目,所以主要是找到pom.xml,项目最好先放在idea的工作目录下,且工作目录最好为英文 1.打开idea,选择import project 2.把项目放到ide ...

  8. 关于Java多线程-interrupt()、interrupted()、isInterrupted()解释

    多线程先明白一个术语"中断状态",中断状态为true,线程中断. interrupt():就是通知中止线程的,使"中断状态"为true. isInterrupt ...

  9. python基础语法_9-0函数概念

    http://www.runoob.com/python3/python3-function.html 函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段. 函数能提高应用的模块性,和代 ...

  10. 《手把手教你》系列技巧篇(六十七)-java+ selenium自动化测试 - 读写excel文件 - 中篇(详细教程)

    1.简介 前面介绍了POI可以操作excel,也简单的提到另一个操作excle的工具,本篇介绍一个其他的可以操作excel的工具,但是这个工具有一个前提,excel文件版本只能是97-2003版本,如 ...