Python科学计算学习之高级数组（二）

代码性能和向量化

背景：Python是一种解释型的编程语言，基本的python代码不需要任何中间编译过程来得到机器代码，而是直接执行。而对于C、C++等编译性语言就需要在执行代码前将其编译为机器指令。但是，解释型代码的速度比编译型代码要慢，为了使得python代码更快，最好尽可能的使用Numpy和Scipy包中的函数编写部分代码。（注意：numpy和scipy是诸如C、C++等编译型语言编写实现的）

例如：Python语言的numpy向量化语句为什么比for快？

python之类语言的for循环，和其它语言相比，额外付出了什么。

python是解释执行的。举例来说，执行 x = 1234+5678 ，对编译型语言，是从内存读入两个short int到寄存器，然后读入加法指令，通知CPU内部的加法器动作，最后把加法器输出存储到x对应的内存单元（实质上，最后这个动作几乎总会被自动优化为“把加法器输出暂存到寄存器而不是内存单元，因为访问内存的时间消耗常常是访问寄存器的几十倍”）。一共2~4条指令（视不同CPU指令集而定）。

而换了解释性语言，它得先把“x = 1234+5678”当成字符串，逐个字符比对以分析语法结构——不计空格这也是11个字符，至少要做11个循环；每个循环至少需要执行的指令有：取数据（如读'x'这个字符）、比较数据、根据比较结果跳转（可能还得跳转回来）、累加循环计数器、检查循环计数器是否到达终值、根据比较结果跳转。这就是至少6条指令，其中包含一次内存读取、至少两次分支指令（现代CPU有分支预测，若命中无额外消耗，否则……）。总计66条指令，比编译型语言慢至少17倍（假设每条指令执行时间相同。但事实上，访存/跳转类指令消耗的时间常常是加法指令的十倍甚至百倍）。这还只是读入源码的消耗，尚未计入“语法分析”这个大头；加上后，起码指令数多数百倍（消耗时间嘛……我猜起码得多数千倍吧）。

向量化：

为提升代码的性能（运行时间），通常需要将代码向量化。使Numpy包的切片、运算符和函数来替代代码中的for循环以及运行速度较慢的代码片段，可以显著提高代码的性能。

规则：尽可能避免使用for循环而采用向量化形式，善用python的numpy库中的内置函数。例如：np.exp ,np.log ,np.maxmum(v,0) 等。

简单实例进行说明：

import numpy as np

import time

a = np.random.rand(1000000)

b = np.random.rand(1000000)

tic = time.time()

c = np.dot(a, b) #向量化运算

toc = time.time()

print("c: %f" % c)

print("vectorized version:" + str(1000*(toc-tic)) + "ms")

#采用for循环语句进行编程

c = 0

tic = time.time()

for i in range(1000000):

c += a[i] * b[i]

toc = time.time()

print("c: %f" % c)

print("for loop:" + str(1000*(toc-tic)) + "ms")

运行结果：

c: 250099.479223

vectorized version:32.00173377990723ms

c: 250099.479223

for loop:1680.09614944458ms #可见，向量化的实现代码速度上有飞速提升，而且代码看起#来更加简洁。

##说明，无论有多长的数据列表并且需要对他们进行数学转换，考虑将这些python数据

结构转换为numpy.ndarray对象并使用固有的矢量化功能。

Python广播

当两个数组中每个元素都进行相应的运算的时候，需要两个数组的形状相同，如果形状不同，则使Python的广播机制进行处理。例如,当一个向量（一维数组）和一个标量（零维数组）相加时，为了能够执行加法，标量需扩展为向量，这种通用机制称为广播。

3.1广播数组：

“广播”的一个工作原则是：两个数组的维度应该相同（即要对一个二维数组进行广播，那么用来广播的数组也应该是二维的），并且只能有一个维度的长度允许不一样，且那个不一样的维度在用来广播的数组里面的长度应该为1（比如，对于一个（3,4）的二维数组，那么用来广播的数组必须是（3,1）或（1,4）；比如对于一个三维的数组（3,4,5），用来广播的数组必须是（1,4,5）或（3,1,5）或（3,4,1）），这样子，我们才说两个数组是广播兼容的。广播会在沿着长度为1的那个维度进行扩散进行。（广播原则：如果两个数组的后缘维度（即：从末尾算起的维度）的轴长相符或者其中的一方长度为1，则认为广播兼容，广播在缺失和长度为1的轴上进行）

如下实例：说明广播是如何操作的：重塑、扩展

import numpy as np

a=np.arange(0,60,10).reshape(-1,1) #建立一个二维数组，形状数（6，1）

print(a.shape)

print(a)

b=np.arange(0,5) #建立一个一维数组b（向量），形状为（5，）

print(b.shape)

print(b)

c=a+b #注意：此处向量需要被广播，第一运算步骤为：重塑，将向量的形状从（5，）转换为（1，5）。第二步运算是扩展，将向量的形状从（1，5）转换为（6，5）。 #注意：形状（n,）不能自动广播到向量（m,n）

print(c.shape)

print(c)

运行结果：

(6, 1)

[[ 0]

[10]

[20]

[30]

[40]

[50]]

(5,)

[0 1 2 3 4]

(6, 5)

[[ 0 1 2 3 4]

[10 11 12 13 14]

[20 21 22 23 24]

[30 31 32 33 34]

[40 41 42 43 44]

[50 51 52 53 54]]

解释：

首先b.shape=(1,5) #由于a与b的维数不一样，首先需让b的维度（shape

#属性性）向a对齐，即向量变为矩阵

print(b.shape)

print(b)

其次，加法的两个输入数组属性分别为（6，1）和（1，5），输出数组的各个轴的长度为输入数组各个轴的长度的最大值，则输出数组的属性为（6，5）；将b在第0轴进行复制，a在第一轴上进行复制。

结果为：

a=a.repeat(5,axis=1)

print(a)

b=b.repeat(6,axis=0)

print(b)

[[ 0 0 0 0 0]

[10 10 10 10 10]

[20 20 20 20 20]

[30 30 30 30 30]

[40 40 40 40 40]

[50 50 50 50 50]]

[[0 1 2 3 4]

[0 1 2 3 4]

[0 1 2 3 4]]

注意：numpy内部不会使用repeat进行数据扩展，而是使用内部集成的函数ogrid（创建广播预算用的数组）和mgrid函数（返回是进行广播后的数组）

3.2 Python的广播方便与计算：

①　一维向量+常量

import numpy as np

vector=np.arange(4)

b=vector+1.

print(b.shape)

print(b) #result为：(4,) 向量[1. 2. 3. 4.]

②　多维向量+常数

③　多维向量+行向量

④　多维向量+列向量

a=np.array([[1,2,3],[4,5,6]])

b=[1,2,3]

c=[[4],[5]]

print(a)

print(a+1)

print(a+b)

print(a+c) #运行结果：

[[1 2 3]

[4 5 6]]

[[2 3 4]

[5 6 7]]

[[2 4 6]

[5 7 9]]

[[ 5 6 7]

[ 9 10 11]]

Python科学计算学习之高级数组（二）的更多相关文章

python科学计算_numpy_线性代数/掩码数组/内存映射数组
1. 线性代数 numpy对于多维数组的运算在默认情况下并不使用矩阵运算,进行矩阵运算可以通过matrix对象或者矩阵函数来进行: matrix对象由matrix类创建,其四则运算都默认采用矩阵运算, ...
Python3.0科学计算学习之绘图（二）
(1) np.mashgrid()函数:-----生成网络点坐标矩阵,可以是二维网络矩阵,也可以是三维网络矩阵.其中,每个交叉点就是网络点,描述这些网络点的矩阵就是坐标矩阵(横坐标矩阵X中的每个元素与 ...
Python科学计算学习一 NumPy 快速处理数据
1 创建数组 (1) array(boject, dtype=None, copy=True, order=None, subok=False, ndmin=0) a = array([1, 2, 3 ...
Python科学计算（二）windows下开发环境搭建（当用pip安装出现Unable to find vcvarsall.bat）
用于科学计算Python语言真的是amazing! 方法一:直接安装集成好的软件刚开始使用numpy.scipy这些模块的时候,图个方便直接使用了一个叫做Enthought的软件.Enthought ...
Python学习之高级数组（一）
1.Python基础学习之高级数组(一) 1.1视图:就是与较大数组共享相同数据的较小数组.Numpy包提供数据视图的概念是为了精确地控制内存的使用方式. 数组视图.切片视图.转置和重塑视图等数组 ...
Python科学计算库
Python科学计算库一.numpy库和matplotlib库的学习 (1)numpy库介绍:科学计算包,支持N维数组运算.处理大型矩阵.成熟的广播函数库.矢量运算.线性代数.傅里叶变换.随机数生成 ...
Python科学计算基础包-Numpy
一.Numpy概念 Numpy(Numerical Python的简称)是Python科学计算的基础包.它提供了以下功能: 快速高效的多维数组对象ndarray. 用于对数组执行元素级计算以及直接对数 ...
Python科学计算结果的存储与读取
Python科学计算结果的存储与读取总结于2019年3月17日荆楚理工学院计算机工程学院一.前言显然,作为一名工科僧,执行科学计算,需用Python.PS:快忘记Matlab吧.我用了二十 ...
Python科学计算之Pandas
Reference: http://mp.weixin.qq.com/s?src=3&timestamp=1474979163&ver=1&signature=wnZn1UtW ...

随机推荐

用 zotero 管理文献和个人知识库
这周开始用了一下 zotero. 这是一款非常好用的文献管理工具,但它更像是一个多功能的收藏夹,或者说是一个知识.笔记.文献的综合管理工具. 入门的时候搜到了阳志平老师的几个图文并茂的教程,这里也推荐 ...
java集成swagger
概览: java集成Swagger Swagger-UI的使用 Springboot跨域请求的访问解决 Swagger 是一个规范和完整的框架,用于生成.描述.调用和可视化 RESTful 风格的 W ...
详述 hosts 文件的作用及修改 hosts 文件的方法
1 什么是hosts文件? hosts是一个没有扩展名的系统文件,其基本作用就是将一些常用的网址域名与其对应的 IP 地址建立一个关联“ 数据库 ”.当用户在浏览器中输入一个需要登录的网址时,系统会首 ...
[tensorflow]图像处理相关模块的安装（python3中PIL）
直接上过程图(平台为Anaconda): 默认已经配置完了tensorflow的3.5的环境我这里已经安装完成接下来,就可以在python文件中引入模块了 from PIL import Imag ...
NEO GUI 多方签名使用
众所周至,NEOGUI是一个开发者演示用钱包,使用体验是非常的不友好的. 今天本来打算使用多方签名账户,发现和想象的不一样,请教了小伙伴也不行.遂调试了一下原因,发现踩进坑里了. 把这个问题记 ...
潭州课堂25班：Ph201805201 tornado 项目第十课深入应用异步和协程（课堂笔记）
tornado 相关说明需求: 增加 /save 的 handler,实现异步保存指定 URL 图片的功能从网页上得到一张图片地址,由这个地址将图片保存到服务器,并将相关数据保存到数据库 impo ...
python学习:注释、获取用户输入、字符串拼接、运算符、表达式
注释 #为单行注释'''三个单引号(或者"""三个双引号)为多行注释,例如'''被注释的内容''' '''三个单引号还可以起到多行打印的功能. #ctrl+? 选中的多行 ...
windows 2008下IIS7 安装ASP.NET 遇到500.19
windows 2008下IIS7 安装ASP.NET 遇到如下错误: HTTP 错误 500.19 - Internal Server Error 无法访问请求的页面,因为该页的相关配置数据无效. ...
PC_官网设计
1. 头部 header 固定的两种方式固定定位内容区包裹,使用 overflow: hidden; 2. 动画第二次起效缺少动画初始参数 3. 隐藏元素 display: none; vi ...
Tomcat报错invalid LOC header
原因: 可能是jar包有问题. 解决方法: 1.找到加载不了的类对应的jar包. 2.在tomcat中webapps/INF/lib中找到对应的jar包,然后删除. 3.重新下载其它版本的jar包. ...

Python科学计算学习之高级数组（二）

Python科学计算学习之高级数组（二）的更多相关文章

随机推荐

热门专题