欢迎关注公众号【Python开发实战】, 获取更多内容!

工具-numpy

numpy是使用Python进行数据科学的基础库。numpy以一个强大的N维数组对象为中心，它还包含有用的线性代数，傅里叶变换和随机数函数。

算术运算

导入numpy

import numpy as np

所有常用的算术运算+，-，*，/，//，%，**等等，都可以应用在ndarray上，且这些运算是方面级的。

a = np.array([14, 23, 32, 4])

b = np.array([5, 4, 3, 2])

print('a + b =', a + b)

print('a - b =', a - b)

print('a * b =', a * b)

print('a / b =', a / b)

print('a // b =', a // b)

print('a % b =', a % b)

print('a ** b =', a ** b)

输出：

a + b = [19 27 35  6]

a - b = [ 9 19 29  2]

a * b = [70 92 96  8]

a / b = [ 2.8         5.75       10.66666667  2.        ]

a // b = [ 2  5 10  2]

a % b = [4 3 2 0]

a ** b = [537824 279841  32768     16]

需要注意的是，上面的乘法运算不是矩阵乘法，下面会介绍矩阵乘法。

上面算术运算的前提是ndarray必须有一样的形状，否则numpy将会应用广播机制。

广播

第一条规则

当ndarray没有相同的秩时，那么将为秩较小ndarray的形状数组上加入1，直到他们的秩匹配为止。

h = np.arange(5).reshape(1, 1, 5)

h

输出：

array([[[0, 1, 2, 3, 4]]])

现在尝试将一个形状为（5，）的一维数组加到这个形状为（1，1，5）的三维数组上，遵循第一条广播规则，结果如下：

h + np.array([10, 20, 30, 40, 50])   # 相当于h + np.array([[[10, 20, 30, 40, 50]]])

输出：

array([[[10, 21, 32, 43, 54]]])

第二条规则

在特定维度为1的数组，沿着该维度将元素的值进行重复，直到和在该维度上拥有最大形状的ndarray大小相同为止。

k = np.arange(6).reshape(2, 3)

k

输出：

array([[0, 1, 2],

       [3, 4, 5]])

现在让一个形状为（2,1）的二维ndarray加到形状为（2， 3）的二维数组上，numpy将会应用第二条广播规则。

k + np.array([[100], [200]])  # 相当于 k + =np.array([[100, 100, 100], [200, 200, 200]])

输出：

array([[100, 101, 102],

       [203, 204, 205]])

结合规则1和规则2：

k + np.array([100, 200, 300]) # 应用规则1： [[100, 200, 300]], 再应用规则2：[[100, 200, 300], [100, 200, 300]]

输出：

array([[100, 201, 302],

       [103, 204, 305]])

k + 1000 # 相当于 k + [[1000, 1000, 1000], [1000, 1000, 1000]]

输出：

array([[1000, 1001, 1002],

       [1003, 1004, 1005]])

第三条规则

在规则1和规则2之后，第三条规则是所有数组的大小必须匹配，如下

try:

    k + [33, 44]

except ValueError as e:

    print(e)

operands could not be broadcast together with shapes (2,3) (2,)

广播规则用于许多numpy运算，不仅仅是算术运算，下面会介绍。

Upcasting

当尝试组合具有不同数据类型的ndarray时，numpy将向上转换为更通用或精确度更高的数据类型，无论实际值是什么。

k1 = np.arange(0, 5, dtype=np.uint8)

print(k1.dtype, k1)

输出：

uint8 [0 1 2 3 4]

k2 = k1 + np.array([5, 6, 7, 8, 9], dtype=np.int8)

print(k2.dtype, k2)

输出：

int16 [ 5  7  9 11 13]

上面这种情况尽管uint8就足够了，但是需要使用int16来表示所有可能的int8和uint8值（从-128到255）。

k3 = k1 + 1.5

print(k3.dtype, k3)

输出：

float64 [1.5 2.5 3.5 4.5 5.5]

条件运算

条件运算也适用于元素

m = np.array([20, -5, 30, 40])

m < [15, 16, 35, 36]

输出：

array([False,  True,  True, False])

m < 25  # 等同于 m < [25, 25, 25, 25], 应用了广播机制

输出：

array([ True,  True, False, False])

这与布尔索引结合起来使用非常有用。

m[m < 25]

输出：

array([20, -5])

数学和统计函数

许多数学和统计函数也适用于ndarray。

ndarray的方法

一些函数仅仅是ndarray的方法，例如：

a = np.array([[-2.5, 3.1, 7], [10, 11, 12]])

print(a)

print("mean = ", a.mean())

输出：

[[-2.5  3.1  7. ]

 [10.  11.  12. ]]

mean =  6.766666666666667

不管ndarray的形状如何，mean()函数将会计算ndarray中所有元素的平均值。

这有一些更实用的ndarray方法

for func in (a.min, a.max, a.sum, a.prod, a.std, a.var):

    print(func.__name__, '=', func())

输出：

min = -2.5

max = 12.0

sum = 40.6

prod = -71610.0

std = 5.084835843520964

var = 25.855555555555554

这些函数可以接受一个可选参数axis,该参数允许对给定轴上的元素执行操作。例如：

c = np.arange(24).reshape(2, 3, 4)

c

输出：

array([[[ 0,  1,  2,  3],

        [ 4,  5,  6,  7],

        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],

        [16, 17, 18, 19],

        [20, 21, 22, 23]]])

c.sum(axis=0) # 跨矩阵求和

输出：

array([[12, 14, 16, 18],

       [20, 22, 24, 26],

       [28, 30, 32, 34]])

c.sum(axis=1)  # 跨行求和

输出：

array([[12, 15, 18, 21],

       [48, 51, 54, 57]])

c.sum(axis=2)

输出：

array([[ 6, 22, 38],

       [54, 70, 86]])

也可以在多个轴上求和

c.sum(axis=(0, 2))

输出：

array([ 60,  92, 124])

通用函数

numpy还提供了快速的元素级函数，它们被称为通用函数或ufunc。它们是简单函数的矢量化包装。例如，square返回一个新ndarray，它是原始ndarray的副本，但每个元素是原来元素的平方。

a = np.array([[-2.5, 3.1, 7], [10, 11, 12]])

np.square(a)

输出：

array([[  6.25,   9.61,  49.  ],

       [100.  , 121.  , 144.  ]])

还有一些更实用的一元通用函数。

print('Original ndarray')

print(a)

for func in (np.abs, np.sqrt, np.exp, np.log, np.sign, np.ceil, np.modf, np.isnan, np.cos):

    print('\n', func.__name__)

    print(func(a))

# modf: 将ndarray各元素的小数和整数部分以两个独立数组形式返回

# ceil: 向上取整

输出：

Original ndarray

[[-2.5  3.1  7. ]

 [10.  11.  12. ]]

 absolute

[[ 2.5  3.1  7. ]

 [10.  11.  12. ]]

 sqrt

[[       nan 1.76068169 2.64575131]

 [3.16227766 3.31662479 3.46410162]]

 exp

[[8.20849986e-02 2.21979513e+01 1.09663316e+03]

 [2.20264658e+04 5.98741417e+04 1.62754791e+05]]

 log

[[       nan 1.13140211 1.94591015]

 [2.30258509 2.39789527 2.48490665]]

 sign

[[-1.  1.  1.]

 [ 1.  1.  1.]]

 ceil

[[-2.  4.  7.]

 [10. 11. 12.]]

 modf

(array([[-0.5,  0.1,  0. ],

       [ 0. ,  0. ,  0. ]]), array([[-2.,  3.,  7.],

       [10., 11., 12.]]))

 isnan

[[False False False]

 [False False False]]

 cos

[[-0.80114362 -0.99913515  0.75390225]

 [-0.83907153  0.0044257   0.84385396]]

二元通用函数

还有许多二元通用函数，它们在两个ndarray上按元素应用，如果ndarray形状不同，则应用广播规则。

a = np.array([1, -2, 3, 4])

b = np.array([2, 8, -1, 7])

np.add(a, b)   # 相当于 a + b

输出：

array([ 3,  6,  2, 11])

np.greater(a, b)   # 相当于 a > b

输出：

array([False, False,  True, False])

np.maximum(a, b)

输出：

array([2, 8, 3, 7])

np.copysign(a, b) # 将b中各元素的符号赋给a的对应元素

输出：

array([ 1.,  2., -3.,  4.])

numpy教程03---ndarray的运算的更多相关文章

numpy教程
[转]CS231n课程笔记翻译:Python Numpy教程原文链接:https://zhuanlan.zhihu.com/p/20878530 译者注:本文智能单元首发,翻译自斯坦福CS231n课 ...
转：Numpy教程
因为用到theano写函数的时候饱受数据结构困扰于是上网找了一篇numpy教程(theano的数据类型是基于numpy的) 原文排版更好,阅读体验更佳: http://phddreamer.blog ...
Python 机器学习库 NumPy 教程
0 Numpy简单介绍 Numpy是Python的一个科学计算的库,提供了矩阵运算的功能,其一般与Scipy.matplotlib一起使用.其实,list已经提供了类似于矩阵的表示形式,不过numpy ...
Numpy入门（二）：Numpy数组索引切片和运算
在Numpy中建立了数组或者矩阵后,需要访问数组里的成员,改变元素,并对数组进行切分和计算. 索引和切片 Numpy数组的访问模式和python中的list相似,在多维的数组中使用, 进行区分: 在p ...
NumPy 教程目录
NumPy 教程目录 1 Lesson1--NumPy NumPy 安装 2 Lesson2--NumPy Ndarray 对象 3 Lesson3--NumPy 数据类型 4 Lesson4--Nu ...
[译]Vulkan教程(03)开发环境
[译]Vulkan教程(03)开发环境这是我翻译(https://vulkan-tutorial.com)上的Vulkan教程的第3篇. In this chapter we'll set up y ...
numpy教程：矩阵matrix及其运算
http://blog.csdn.net/pipisorry/article/details/48791403 numpy矩阵简介 NumPy函数库中存在两种不同的数据类型(矩阵matrix和数组ar ...
Numpy数值类型与数值运算-03
什么是NumPy? NumPy是Python中科学计算的基本软件包.它是一个Python库,提供多维数组对象,各种派生对象(例如蒙版数组和矩阵) 以及各种例程,用于对数组进行快速操作,包括数学,逻辑, ...
3.4Python数据处理篇之Numpy系列(四)---ndarray 数组的运算
目录目录 (一)数组与标量的运算 1.说明: 2.实例: (二)元素级的运算(一元函数) 1.说明: 2.实例: (三)数组级的运算(二元函数) 1.说明: 2.实例: 目录 1.数组与标量的运算 ...

随机推荐

vue 组件间的几种通信方式
Props配置原理:通过props配置,进行父子组件间的通信,跨父子通信需要其他组件进行过渡. 使用: 传递方在标签中添加传递内容 <Son :newName="name" ...
java反射之java 泛型的本质
1.泛型反射API用来生成在当前JAVA虚拟机中的类.接口或者对象的信息.Class类:反射的核心类,可以获取类的属性,方法等内容信息.Field类:Java.lang.reflect.表示类的属性 ...
前面顺序表的补充（复杂度，未实现的算法，空间扩展）（基于c语言）
0.对于顺序表中的n个元素,如果在下标i的位置之前插入一个元素,则需要将后面n-i个元素向后移动一位:如果是删除下标为i处的元素,则是则需要将后面n-i-1个元素向前移动一位.如果说在i的位置插入和删 ...
OOS 预览报错解决思路
预览报错解决思路: 官方链接:https://docs.microsoft.com/zh-cn/officeonlineserver/office-online-server :> 查看服务器内 ...
toppo-1
靶机准备由于是.vmdk文件,新建一个虚拟机把硬盘移除,在将此vmdk文件添加为新硬盘即. 开机发现给出了ip地址:192.168.164.184,且当前网络模式为NAT 将kali也设置为NAT模 ...
在线Remix链接本地文件夹
问题 1.本地Remix环境版本滞后于在线编译器,新版本的语法在旧版本编译器中出现错误. 2.没有配置Vscode编译器,不便导入项目. 解决方案 *本解决方案基于Mac系统创建共享文件夹在本地创 ...
教你识别一些sequence的相关问题
摘要:通过一些自定义的视图或者查询语句,批量识别集群的sequence相关问题本文分享自华为云社区<GaussDB(DWS)运维 -- sequence常见运维操作>,作者: 譡里个檔. ...
运行 Spring Boot 有哪几种方式？
打包用命令或者放到容器中运行用 Maven/ Gradle 插件运行直接执行 main 方法运行
MySQL使用日期列作为UNIQUE索引
https://dev.mysql.com/doc/refman/8.0/en/date-and-time-functions.html#function_extract https://dev.my ...
A5/web项目连接Oracle 12c数据库报：ORA-01017: 用户名/口令无效
解决办法: 修改Oracle12c用户名密码,再改回来,就ok了,亲测有效.

numpy教程03---ndarray的运算