Numpy学习笔记(上篇)
Numpy学习笔记(上篇)
一、Jupyter Notebook的基本使用
首先需要安装anaconda,安装完成之后会自带Jupyter Notebook,启动之后会自动打开默认浏览器,启动一个“在线终端”,然后选择路径之后,就可以开心滴使用啦!debug时很好用,能随时随地可视化每一步的结果。小Tip:查看jupyter Notebook中的快捷键:
常用快捷键:
A: 在上面插入代码块 B: 在下面插入代码块 X: 剪切选择的代码块
C: 复制选择的代码块 Y: 把代码块变成代码 M: 把代码块变成标签
L: 显示行号
Shift-Enter: 运行代码块, 选择下面的代码块
Ctrl-Enter: 运行选中的代码块
Alt-Enter: 运行代码块并且插入下面
此外,在Jupyter Notebook中可以使用markdown格式写一些备注等。markdown使用方法:
二、Jpuyter Notebook的魔法命令
1、%run
用来直接调用外部脚本命令,举个例子,现在有这么一个函数:
def main():
for i in range(5):
print("hello world")
main()
如果直接pycharm这种IDE中很容易就能运行出结果,但是如果想要在Jupyter Notebook中调用这个函数呢?
%run xxx文件路径/xxx.py
这样就把这个函数加载进了jupyter notebook,这样方便再次调用。
2、%timeit & %%timeit
%timeit L = [i**2 for i in range(1000)]
运行输出结果:275 µs ± 6.83 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
%timeit L = [i**2 for i in range(1000000)]
运行输出结果:302 ms ± 2.17 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
它会自动运算很多次,然后取平均值,至于多少次需要根据你的运算量和电脑性能综合考虑。timeit这个魔法命令后面智能接一行代码也就是一个语句,如果想要运行一个代码块呢?那就使用%%timeit
%%timeit
L = []
for i in range(1000):
L.append(i**2)
运行输出结果:288 µs ± 4.03 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
那么此时还有一个问题,就是有时我们不需要计算多次取平均值,就是想只算一次时间。怎么办?
此外还有一个问题需要注意的是在相同一段程序执行多次时间差异很大的时候,比如排序算法,事先排好序和乱序丢一个数据查找或搜索,所用的时间一定是不一样的。因此在计算时间的时候需要留意。
3、%time
使用方法和timeit一样,区别就是time对于时间只计算一次。但是如果只计算一次时间是不准确的,因为在运算的过程中不仅要考虑cpu的运行状态,线程等还要有初始加载一些包所带来的延迟,所以同一段代码运行的多次,时间可能不太一样。
%time L = [i**2 for i in range(1000000)]
运行输出结果: Wall time: 292 ms
%%time
L = []
for i in range(1000):
L.append(i**2)
运行输出结果:Wall time: 12.7 ms
4、其他魔法命令
%lsmagic
这样就能查看到所有的魔法命令,如果有需要可以去单独查询某个魔法命令的具体用法。或者使用jupyter Notebook中的帮助命令,在jupyter notebook中运行%xxx?命令之后,会出一个弹框,里面有具体的使用方法,其他命令也是如此。
二、Numpy.array基础
查询版本号
import numpy
numpy.__version__运行输出结果:'1.16.2'
import numpy as np
np.__version__sion__运行输出结果:'1.16.2'
为什么要使用numpy.array呢?
我们先来看一下python list的特点。
L = [i for i in range(10)]
L运行输出结果:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
L[5] = 100
L运行输出结果:[0, 1, 2, 3, 4, 100, 6, 7, 8, 9]
L[5] = "Macchine learning"
L运行输出结果:[0, 1, 2, 3, 4, 'Macchine learning', 6, 7, 8, 9]
通过上面的例子我们可以发现在python中list的元素可以很容易被修改或者替换,但是这也带来一个问题,就是效率相对比较低。因为它要检查每个元素是哪种类型。那么在python其实也有只能创建一种类型的数组。
import array
arr = array.array('i', [i for i in range(10)])
arr运行输出结果:array('i', [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
那么此时我们再把array中的元素赋值为字符串时就会报错!这个虽然降低了array的灵活性,但是提高了效率。但是array又有一定的缺点,那就是它只是单纯滴把这个数组看成一组数据,既不是向量也不是矩阵,而且没有向量和矩阵的运算。所以numpy array出现!
3.numpy array
import numpy as np
nparr = np.array([i for i in range(10)])
nparr运行输出结果:array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
既然array只能存储一种数据类型,那么我们来查看一下:
nparr.dtype
运行输出结果:dtype('int32')
nparr[5] = 5.0
nparr运行输出结果:array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
此时我们可以发现哪怕我们把数据中某个元素赋值为浮点型数据,最终的结果依旧是int32。其实是np进行了隐式的数据转换。他会自动进行数据截位。
nparr2 = np.array([1, 2, 3.0])
nparr2.dtype运行输出结果:dtype('float64')
三、创建numpy数组与矩阵
np.zeros(shape=?, dtype=?) 默认就是浮点型
import numpy as np
np.zeros(10)运行输出结果:array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
通过运行结果就可以发现array是一个浮点型的数据,那么如果想要创建整形呢?
import numpy as np
np.zeros(10, dtype=int)运行输出结果:array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])
import numpy as np
np.zeros(shape=(3, 5), dtype=int)运行输出结果:
array([[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0]])np.ones(shape=?, dtype=?)
import numpy as np
np.ones(10)运行输出结果:array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
import numpy as np
np.ones(shape=(3, 5), dtype=int)运行输出结果:
array([[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1]])np.full(shape=?, fill_value=?)
import numpy as np
np.full((3, 5), 666)运行输出结果:
array([[666, 666, 666, 666, 666],
[666, 666, 666, 666, 666],
[666, 666, 666, 666, 666]])np.arange(起始值,终止值,步长), 默认步长为1
np.arange()和range()用来基本相同,区别在于,range的步长必须为整数,而np.array可以是小数。
import numpy as np
np.arange(0, 1, 0.2)运行输出结果:array([0. , 0.2, 0.4, 0.6, 0.8])
np.linspace(起始值,终止值,数量),就是在起始值和终止值之间去数量个数,包括起始值和终止值。
import numpy as np
np.linspace(1, 20, 5)运行输出结果:array([ 1. , 5.75, 10.5 , 15.25, 20. ])
np.random
- np.random.randint() 从0-10之间创建一个随机整数
import numpy as np
np.random.randint(0, 10)运行输出结果:5
import numpy as np
np.random.randint(0, 10, 10)运行输出结果:array([9, 5, 2, 0, 5, 3, 5, 3, 0, 4])
import numpy as np
np.random.randint(0, 10, size=(3, 5))运行输出结果:
array([[5, 2, 1, 9, 1],
[0, 3, 9, 4, 1],
[6, 2, 3, 6, 8]]) 在机器学习算法中,有很多地方都会用到随机初始化的这一方法,那么这样对于调试代码就带来了一定的麻烦,其实,在计算机当中,所谓的随机数都是伪随机数。靠随机数生成算法完成的。那么就有了随机种子。在numpy中np.random.seed(),这样运行多少次都是这样的随机数。
- np.random.seed()
import numpy as np
np.random.seed(666)
np.random.randint(0, 10, size=(3, 5))运行输出结果:
array([[2, 6, 9, 4, 3],
[1, 0, 8, 7, 5],
[2, 5, 5, 4, 8]])- np.random.random() 生成一个0-1之间均匀分布的随机数。
import numpy as np
np.random.random()运行输出结果:0.7315955468480113
import numpy as np
np.random.random(10)运行输出结果:
array([0.8578588 , 0.76741234, 0.95323137, 0.29097383, 0.84778197,
0.3497619 , 0.92389692, 0.29489453, 0.52438061, 0.94253896])import numpy as np
np.random.random((2, 3))运行输出结果:
array([[0.07473949, 0.27646251, 0.4675855 ],
[0.31581532, 0.39016259, 0.26832981]])- np.random.normal() 生成一个0-1之间正态分布的随机数。
import numpy as np
np.random.normal()运行输出结果:0.7760516793129695
import numpy as np
np.random.normal(10, 100) # 均值为10,方差为100运行输出结果:128.06359754812632
import numpy as np
np.random.normal(0, 1, (3, 5))运行输出结果:
array([[ 0.06102404, 1.07856138, -0.79783572, 1.1701326 , 0.1121217 ],
[ 0.03185388, -0.19206285, 0.78611284, -1.69046314, -0.98873907],
[ 0.31398563, 0.39638567, 0.57656584, -0.07019407, 0.91250436]])- 查询文档,查看函数中的每个参数的默认值等等
np.random.normal?
np.random?
help(np.random.normal)
四、Numpy.array的基本操作
import numpy as np
x = np.arange(10)
X = np.arange(15).reshape(3, 5)
运行输出结果:array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
运行输出结果:
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
基本属性
- ndim
x.ndim
X.ndim运行输出结果:1
运行输出结果:2
- shape
x.shape
X.shape运行输出结果:(10,)
运行输出结果:(3, 5)
- size
x.size
X.size运行输出结果:10
运行输出结果:15
数据访问
- 一维数组
x[0]
X[0][0] # 在多维数组中不建议这样使用,建议使用X[0, 0]运行输出结果:0
运行输出结果:0
x[2:]
x[5:]
x[::2] # 表示从头到尾每间隔2取一个x[::-1]
运行输出结果:array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0])
- 二维数组
比较一下下面这两种方法。
X[:2][:3]
X[:2, :3]X[::-1, ::-1]
运行输出结果:
array([[14, 13, 12, 11, 10],
[ 9, 8, 7, 6, 5],
[ 4, 3, 2, 1, 0]])- 子数组
subX = X[:2, :3]
subX运行输出结果:
array([[0, 1, 2],
[5, 6, 7]]) 如果对subX中的元素进行修改赋值,那么会不会对X造成影响呢?
subX[0, 0] = 100
subX运行输出结果:
array([[100, 1, 2],
[ 5, 6, 7]])X
运行输出结果:
array([[100, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[ 10, 11, 12, 13, 14]]) 此时,会发现X也发生了变化,在python中对列表进行切片的时候是创建了一个新的列表,但是在numpy.array中采取的是引用的方式,如果对其子数组进行修改原数组也会进行相应的改变,这样能够提升效率。
reshape
x.reshape(2, 5)
运行输出结果:
array([[0, 1, 2, 3, 4],
[5, 6, 7, 8, 9]]) 此时x并没有发生改变,因此我们需要将其进行赋值给一个变量。
B = x.reshape(1, 10)
B运行输出结果:array([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])
C = x.reshape(10, -1)
C运行输出结果:
array([[0],
[1],
[2],
[3],
[4],
[5],
[6],
[7],
[8],
[9]])
我是尾巴
每篇一句毒鸡汤:明明才二十来岁,为什么有一种一辈子就这样了的感觉?
这是上篇,下篇继续!本次推荐:一款可以随意编辑pdf的软件,Icecream PDF editor
加油ヾ(◍°∇°◍)ノ゙
Numpy学习笔记(上篇)的更多相关文章
- Numpy学习笔记(下篇)
目录 Numpy学习笔记(下篇) 一.Numpy数组的合并与分割操作 1.合并操作 2.分割操作 二.Numpy中的矩阵运算 1.Universal Function 2.矩阵运算 3.向量和矩阵运算 ...
- NumPy学习笔记 三 股票价格
NumPy学习笔记 三 股票价格 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.&l ...
- NumPy学习笔记 二
NumPy学习笔记 二 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.<数学分 ...
- NumPy学习笔记 一
NumPy学习笔记 一 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.<数学分 ...
- numpy 学习笔记
numpy 学习笔记 导入 numpy 包 import numpy as np 声明 ndarray 的几种方法 方法一,从list中创建 l = [[1,2,3], [4,5,6], [7,8,9 ...
- Python数据分析:Numpy学习笔记
Numpy学习笔记 ndarray多维数组 创建 import numpy as np np.array([1,2,3,4]) np.array([1,2,3,4,],[5,6,7,8]) np.ze ...
- 数据分析之Pandas和Numpy学习笔记(持续更新)<1>
pandas and numpy notebook 最近工作交接,整理电脑资料时看到了之前的基于Jupyter学习数据分析相关模块学习笔记.想着拿出来分享一下,可是Jupyter导出来h ...
- numpy学习笔记Ⅰ
一直被numpy和matplotlib困扰,打算好好学习一下,也是从自己的观点,学对自己帮助最大的部分 主要参考<https: www.runoob.com="" numpy ...
- Python numpy学习笔记(一)
下边代码是关于numpy的一些基本用法,包括数组和矩阵操作等... import numpy as np print "<== print version ==>" p ...
随机推荐
- proxysql 学习一 proxysql docker 运行试用
proxysql 是一个比较强大的mysql proxy 服务,支持动态mysql 实例调整,查询重写,查询cache,监控,数据镜像,读写分离 以及ha,最近已经发布了2.0 ,很值得试用下 环境准 ...
- 数据分析师(Data Analyst),数据工程师(Data Engineer),数据科学家(Data Scientist)的区别
数据分析师(Data Analyst):负责从数据中提取出有用的信息,以帮助公司形成业务决策.工作内容包括:对数据进行提取,清洗,分析(用描述统计量,趋势分析,多维度分析,假设检验等统计常用方法对数据 ...
- 计蒜客 39270.Angel's Journey-简单的计算几何 ((The 2019 ACM-ICPC China Shannxi Provincial Programming Contest C.) 2019ICPC西安邀请赛现场赛重现赛
Angel's Journey “Miyane!” This day Hana asks Miyako for help again. Hana plays the part of angel on ...
- EasyEarth三维可视化解决方案——智慧林业
智慧林业 智能巡管监护 护林员信息查询 护林员管护范围查询 护林员报警.采集数据查看 样点.样线管理 其它功能模块 ●一键考勤打卡 ●面积测量 ●任务公告发布 ●实时电量监控 ●一键报警功能 ●北斗短 ...
- centos7安装sql-server2017
1. 关闭selinux Vim /etc/selinux/conf 将selinux=enable 改成selinux=disabled 2. 清空/关闭iptables策略 Iptables ...
- Monkey框架(测试方法篇) - monkey日志分析
Monkey日志分析是Monkey测试中非常重要的一个环节,通过日志分析,可以获取当前测试对象在测试过程中是否会发生异常,以及发生的概率,同时还可以获取对应的错误信息,帮助开发定位和解决问题.介绍日志 ...
- Compute API 关键概念 详解
Compute API 是 RESTful HTTP 服务,提供管理虚机的能力. 虚机可能有不同的内存大小,CPU数量,硬盘大小,能够在几分钟之内创建出来.和虚机的交互,可以通过Compute API ...
- Java 强,弱,软,虚 引用
import java.lang.ref.SoftReference; import java.lang.ref.WeakReference; public class TestGC { /** * ...
- 【软工实践】Beta冲刺(2/5)
链接部分 队名:女生都队 组长博客: 博客链接 作业博客:博客链接 小组内容 恩泽(组长) 过去两天完成了哪些任务 描述 新增修改用户信息.任务完成反馈等功能API 服务器后端部署,API接口的bet ...
- Cookie和Session原理
由于HTTP是无状态的协议,客户程序每次都去web页面,都打开到web服务器的单独的连接,并且不维护客户的上下文信息.如果需要维护上下文信息,比如用户登录系统后,每次都能够知道操作的是此登录用户,而不 ...