NumPy库的基本使用
一、介绍
——NumPy库是高性能科学计算和数据分析的基础包,它是Pandas及其它各种工具的基础
——NumPy里的ndarry多维数组对象,与列表的区别是:
- 数组对象内的元素类型必须一样
- 数组大小不可修改
——数组对象的常用属性:
- T 数组的转置(在多维数组里,将列转成行,行转成列的操作)
- dtype 数据元素的数据类型
- size 数组元素的个数
- ndim 数组的维数
- shape 数组的维度大小
二、创建ndarray对象
1、基本创建数组的方法:
import numpy as np #首先需要导入numpy库 #创建一维的narray对象
a1 = np.array([1,2,3,4,5]) #一个列表 #创建二维的narray对象
a2 = np.array([[1,2,3,4,5],[6,7,8,9,10]]) # 一个列表里套两个列表 #创建多维对象以次类推
指定数据类型:dtype
a = np.array([2,23,4],dtype=np.int)
print(a.dtype)
# int 64
a = np.array([2,23,4],dtype=np.int32)
print(a.dtype)
# int32
a = np.array([2,23,4],dtype=np.float)
print(a.dtype)
# float64
a = np.array([2,23,4],dtype=np.float32)
print(a.dtype)
# float32
自带的几种数组创建方法:
1、zeros:创建全零数组
a = np.zeros((3,4)) # 数据全为0,3行4列
2、ones:创建全一数组, 同时也能指定这些特定数据的 dtype
:
a = np.ones((5,3),dtype = np.int) # 数据为1,5行3列
3、empty:创建全空数组, 其实每个值都是接近于零的数:
a = np.empty((2,2)) # 数据为empty,2行2列
4、arange:传值创建连续数组:
a = np.arange(10) # 默认从0开始到10(不包括10),步长为1
print(a) # 返回 [0 1 2 3 4 5 6 7 8 9] a = np.arange(5,20,2) # 从5开始到20(不包括20),步长为2
print(a) # 返回 [ 5 7 9 11 13 15 17 19]
5、reshape()
函数通常结合arange()
函数使用,改变数组的维度
# 将一维数组a变为3*4的数组
a=np.arange(12).reshape((3,4)) # 将a变回为一维数组
a.reshape((12,))
6、linspace()
函数跟arange()
函数相似,前两个参数指定序列的开头和结尾,第三个参数指定将数组拆分成几个
np.linspace(0,10,5)
# array([ 0. , 2.5, 5. , 7.5, 10. ])
7、random()
函数使用随机数填充数组
# 生成一维数组
a = np.random.random(3)
print(a)
# array([ 0.0092522 , 0.44961339, 0.85684498]) # 生成多维数组
a = np.random.random((3,3))
print(a)
# array([[ 0.50311642, 0.25961784, 0.30587642],
[ 0.55388356, 0.92739877, 0.26140058],
[ 0.63482092, 0.45938232, 0.84053653]])
# 生成的都是0~1范围的小数
三、数组基本操作
1、算术运算符
算术运算符可以用于数组和标量之间
>>> a=np.arange(4)
>>> a
array([0, 1, 2, 3]) >>> a+4
array([4, 5, 6, 7]) >>> a-4
array([-4, -3, -2, -1]) >>> a*4
array([ 0, 4, 8, 12]) >>> a/2
array([0, 0, 1, 1])
还可以用于两个数组之间,这两个数组的元素位置必须相同,也就是具有相同的型
>>> a=np.arange(4)
>>> a
array([0, 1, 2, 3]) >>> b=np.arange(4,8)
>>> b
array([4, 5, 6, 7]) >>> a+b
array([ 4, 6, 8, 10]) >>> a-b
array([-4, -4, -4, -4]) >>> a*b
array([ 0, 5, 12, 21]) >>> a/b
array([0, 0, 0, 0]) #整数相除只取商
>>> a**2
array([ 0, 1, 4, 9])
>>> a%b # 相除后取余数
array([ 0, 5, 12, 21])
对于多维数组是一样适用的,
>>> A=np.arange(9).reshape((3,3))
>>> A
array([[0, 1, 2],
[3, 4, 5],
[6, 7, 8]]) >>> B=np.ones((3,3))
>>> B
array([[ 1., 1., 1.],
[ 1., 1., 1.],
[ 1., 1., 1.]]) >>> A*B
array([[ 0., 1., 2.],
[ 3., 4., 5.],
[ 6., 7., 8.]])
2、数组的索引与切片
A = np.arange(3,15).reshape((3,4))
"""
array([[ 3, 4, 5, 6]
[ 7, 8, 9, 10]
[11, 12, 13, 14]])
在这样的二维数组中,每一行有从0开始的索引,每一行里的元素也有自己的索引,所以:
"""
print(A[2])
# [11 12 13 14] print(A[2,2])
# 13
切片
# 数组也有类似列表的切片操作
A = np.arange(3,15).reshape((3,4))
"""
array([[ 3, 4, 5, 6]
[ 7, 8, 9, 10]
[11, 12, 13, 14]])
""" print(A[1,0:2])
# [7,8] print(A[0:2,1:3])
"""
array([[4, 5]
[8, 9]
[12, 13]])
"""
Numpy 的 copy & deepcopy:
= 的赋值方式会带有关联性:
import numpy as np a = np.arange(4)
# array([0, 1, 2, 3]) b = a
c = a
d = b
改变a的第一个值,b
、c
、d
的第一个值也会同时改变。
a[0] = 11
print(a)
# array([11, 1, 2, 3])
确认b
、c
、d
是否与a
相同。
print(b is a) # True
print(c is a) # True
print(d is a) # True
同样的,更改d
的值,a
、b
、c
也会改变。
d[1:3] = [22, 33] # array([11, 22, 33, 3])
print(a) # array([11, 22, 33, 3])
print(b) # array([11, 22, 33, 3])
print(c) # array([11, 22, 33, 3])
copy()
的赋值方式没有关联性
b = a.copy() # deep copy
print(b) # array([11, 22, 33, 3])
a[3] = 44
print(a) # array([11, 22, 33, 44])
print(b) # array([11, 22, 33, 3])
3、矩阵常用函数
1)最大值最小值
import numpy as np a = np.array([[1,2,3],[4,5,6]])
print(a.max()) #获取整个矩阵的最大值 结果: 6
print(a.min()) #最小值,结果:1 # 可以指定关键字参数axis来获得行最大(小)值或列最大(小)值
# axis=0 行方向最大(小)值,即获得每列的最大(小)值
# axis=1 列方向最大(小)值,即获得每行的最大(小)值
# 例如 print(a.max(axis=0))
# 结果为 [4 5 6] print(a.max(axis=1))
# 结果为 [3 6] # 要想获得最大最小值元素所在的位置,可以通过argmax函数来获得
print(a.argmax(axis=1))
# 结果为 [2 2]
2)平均值
import numpy as np a = np.array([[1,2,3],[4,5,6]])
print(a.mean()) #结果为: 3.5 # 同样地,可以通过关键字axis参数指定沿哪个方向获取平均值
print(a.mean(axis=0)) # 结果 [ 2.5 3.5 4.5]
print(a.mean(axis=1)) # 结果 [ 2. 5.]
3)方差:方差的函数为var()
,方差函数var()
相当于函数mean(abs(x - x.mean())**2)
,其中x为矩阵。
import numpy as np a = np.array([[1,2,3],[4,5,6]])
print(a.var()) # 结果 2.91666666667 print(a.var(axis=0)) # 结果 [ 2.25 2.25 2.25]
print(a.var(axis=1)) # 结果 [ 0.66666667 0.66666667]
4)标准差:标准差的函数为std(),
std()
相当于sqrt(mean(abs(x - x.mean())**2))
,或相当于sqrt(x.var())
。
import numpy as np a = np.array([[1,2,3],[4,5,6]])
print(a.std()) # 结果 1.70782512766 print(a.std(axis=0)) # 结果 [ 1.5 1.5 1.5]
print(a.std(axis=1)) # 结果 [ 0.81649658 0.81649658]
5)中值:中值指的是将序列按大小顺序排列后,排在中间的那个值,如果有偶数个数,则是排在中间两个数的平均值。
import numpy as np
x = np.array([[1,2,3],[4,5,6]]) print(np.median(x)) # 对所有数取中值
# 结果 3.5 print(np.median(x,axis=0)) # 沿第一维方向取中值
# 结果 [ 2.5 3.5 4.5] print(np.median(x,axis=1)) # 沿第二维方向取中值
# 结果 [ 2. 5.]
6)求和:矩阵求和的函数是sum(),可以对行,列,或整个矩阵求和
import numpy as np a = np.array([[1,2,3],[4,5,6]]) print(a.sum()) # 对整个矩阵求和
# 结果 21 print(a.sum(axis=0)) # 对行方向求和
# 结果 [5 7 9] print(a.sum(axis=1)) # 对列方向求和
# 结果 [ 6 15]
7)累积和:
import numpy as np a = np.array([[1,2,3],[4,5,6]]) print(a.cumsum()) # 对整个矩阵求累积和
# 结果 [ 1 3 6 10 15 21] print(a.cumsum(axis=0)) # 对行方向求累积和
"""
结果[[1 2 4]
[5 7 9]]
""" print(a.cumsum(axis=1)) # 对列方向求累积和
"""
结果
[[ 1 3 6]
[ 4 9 15]]
"""
NumPy库的基本使用的更多相关文章
- 安装numpy库
1.先安装pip: 下载地址:http://pypi.python.org/pypi/pip#downloads 下载pip-8.1.2.tar.gz(md5,pgp)完成之后,解压到一个文件夹,cm ...
- Python的numpy库下的几个小函数的用法
numpy库是Python进行数据分析和矩阵运算的一个非常重要的库,可以说numpy让Python有了matlab的味道 本文主要介绍几个numpy库下的小函数. 1.mat函数 mat函数可以将目标 ...
- numpy库:常用基本
numpy 本文主要列出numpy模块常用方法 大部分内容来源于网络,而后经过自己的一点思考和总结,如果有侵权,请联系我 我是一名初学者,有哪些地方有错误请留言,我会及时更改的 创建矩阵(采用ndar ...
- Python数据分析numpy库
1.简介 Numpy库是进行数据分析的基础库,panda库就是基于Numpy库的,在计算多维数组与大型数组方面使用最广,还提供多个函数操作起来效率也高 2.Numpy库的安装 linux(Ubuntu ...
- 数据分析与展示——NumPy库入门
这是我学习北京理工大学嵩天老师的<Python数据分析与展示>课程的笔记.嵩老师的课程重点突出.层次分明,在这里特别感谢嵩老师的精彩讲解. NumPy库入门 数据的维度 维度是一组数据的组 ...
- 初识NumPy库-基本操作
ndarray(N-dimensional array)对象是整个numpy库的基础. 它有以下特点: 同质:数组元素的类型和大小相同 定量:数组元素数量是确定的 一.创建简单的数组: np.arra ...
- numpy库常用基本操作
NumPy数组的维数称为秩(rank),一维数组的秩为1,二维数组的秩为2,以此类推.在NumPy中,每一个线性的数组称为是一个轴(axes),秩其实是描述轴的数量.比如说,二维数组相当于是一个一维数 ...
- Numpy库(个人学习笔记)
一样,咱的计算机还是得先拥有Python,并且安装了Numpy库.有疑问的话可以看这里呦~~~~ 下面开讲: NumPy的主要对象是齐次多维数组.它是一个元素表(通常是数字),并且都是相同类型,由正整 ...
- Numpy库的下载及安装(吐血总结)
Python很火,我也下了个来耍耍一阵子.可是渐渐地,我已经不满足于它的基本库了,我把目光转到了Numpy~~~~~ 然而想法总是比现实容易,因为我之前下的是Python3.3.x,所有没有自带pip ...
- 简单记录numpy库的某些基本功能
这里介绍python的一个库,numpy库,这个库是机器学习,数据分析最经常用到的库之一,也是利用python做数据必须用到的一个库,入门机器学习学的第一个python库就是它了. 先对其导入到pyt ...
随机推荐
- C#视频取帧图
由于项目里页面有许多视频资料需要展示给用户查看,因此需要做一个视频列表,原设计是列表显示视频第一帧图,但实际上很多视频第一帧是纯黑底色. 于是想到用js利用canvas截图,最后发现由于浏览器跨域限制 ...
- 使用json-lib的JSONObject.toBean( )时碰到的日期属性转换的问题
今天碰到这样一个问题:当前台以JSON格式向后台传递数据的时候,对于数据中的日期属性,无法正常转换为相应的Date属性.JSON数据是这样的:{"birthday":"1 ...
- char的定义在iOS和Android下是不同的
char is different in iOS and Android!跨平台开发时很容易忽略的非常坑爹的一个区别. 我的需求是实现一个算法,这个算法在iOS和Android下需要保持一致的结果,很 ...
- ViewerJS 一个在浏览器上查看 PDF 和电子表格的 JavaScript 库
Viewer.js简介 http://viewerjs.org/ 下载Viewer.js压缩包,解压后将ViewerJS文件夹放在网站根目录下 在浏览器地址栏中输入网址http://172.16.8. ...
- .Net框架中的CLR,CTS,ClS的解释
CLR的全称(Common Language Runtime) 公共语言运行时 可以把它理解为包含运行.Net程序的引擎 和 一堆符合公用语言基础(CLI)的类库的集合,他是一个规范的实现,我们开发的 ...
- jsoup解析xml某片段的问题
参考: http://blog.csdn.net/qy20115549/article/details/53556928 <tr> <td class='center'> &l ...
- awk用法总结
简介 awk的命名来自于他的三位创始人Alfred Aho .Peter Weinberger 和 Brian Kernighan 的姓氏的首字母. 有多种版本:New awk(nawk),GNU a ...
- Mac中自定义文件夹中文名
在OSX系统中,我们打开finer,就会看到很多中文名的文件夹,比如“应用程序”.“桌面”等等,而在系统中都是以英文命名的.我们也可以自己去设置中文名. 首先需要找到设置中文的字符串资源文件,路径是/ ...
- 451. Sort Characters By Frequency (sort map)
Given a string, sort it in decreasing order based on the frequency of characters. Example 1: Input: ...
- CodeForces 689B【最短路】
题意: 给你一副图,给出的点两两之间的距离是abs(pos1-pos2),然后给你n个数是表示该pos到x的距离是1. 思路: 直接建边,跑spfa就好了.虽然说似乎题意说边很多,其实只要建一下相邻的 ...