学机器学习做点小笔记，都是Python的NumPy库的基本小操作，图书馆借的书看到的，怕自己还了书后忘了，就记下来。

一般习惯导入numpy时使用 import numpy as np ，不要直接import，会有命名空间冲突。比如numpy的array和python自带的array。

numpy下有两个可以做矩阵的东西，一个叫matrix，一个叫array。matrix指定是二维矩阵，array任意维度，所以matrix是array的分支，但是这个matrix和matlab的矩阵很像，操作也很像：

>>> import numpy as np

>>> a=np.mat('4 3; 2 1')  # 使用字符串来初始化

>>> b=np.mat('1 2; 3 4')

>>> a

matrix([[4, 3],

        [2, 1]])

>>> b

matrix([[1, 2],

        [3, 4]])

>>> a+b  # 对应位置相加

matrix([[5, 5],

        [5, 5]])

>>> a*b  # 矩阵乘法，与matlab相同

matrix([[13, 20],

        [ 5,  8]])

>>> np.multiply(a,b)  # 对应位置乘法，相当于matlab的点乘 “.*”

matrix([[4, 6],

        [6, 4]])

而重点讲讲np.array。

np.array操作

首先是初始化与属性查看

>>> import numpy as np

>>> np.arange(10)  # 从零生成到10-1的一维矩阵

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

>>> a=np.array([0,1,2,3,4,5])  # 因为支持多维，所以用数组来初始化

>>> a

array([0, 1, 2, 3, 4, 5])

>>> a.ndim  # 查看维度

1

>>> a.shape  # 查看矩阵形状尺寸

(6,)

>>> a.dtype  # 查看类型

dtype('int32')

reshape改变矩阵形状，可以改变维度，但是reshape后的数据还是共享原来那一份数据

>>> b=a.reshape(3,2)

>>> b

array([[0, 1],

       [2, 3],

       [4, 5]])

>>> b.ndim

2

>>> b.shape

(3, 2)

>>> b[1][0]=77

>>> b

array([[ 0,  1],

       [77,  3],

       [ 4,  5]])

>>> a

array([ 0,  1, 77,  3,  4,  5])  # 可见b和a其实用的同一个数据

因而要产生的新矩阵不再关联，要使用copy()：

>>> c=a.reshape(3,2).copy()

>>> c

array([[ 0,  1],

       [77,  3],

       [ 4,  5]])

>>> c[0][0]=233

>>> a

array([ 0,  1, 77,  3,  4,  5])

>>> c

array([[233,   1],

       [ 77,   3],

       [  4,   5]])

array的运算：

>>> d=np.array([1,2,3,4,5])  # 一维矩阵运算

>>> d.T  # 转置矩阵

array([1, 2, 3, 4, 5])

>>> d*2  # 每个数据乘以2

array([ 2,  4,  6,  8, 10])

>>> d**2  # 每个数据二次方

array([ 1,  4,  9, 16, 25])

>>> d*d   # 按位置乘，与“d**2”等效，和mat正好相反

array([ 1,  4,  9, 16, 25])

>>> d.dot(d)  # 矩阵乘法，和mat相反

55

>>> x=np.array([[1,2],[3,4],[5,6]])  # 二维矩阵运算

>>> y=np.array([[6,5,4],[3,2,1]])

>>> x

array([[1, 2],

       [3, 4],

       [5, 6]])

>>> y

array([[6, 5, 4],

       [3, 2, 1]])

>>> x.dot(y)  # 二维矩阵矩阵乘法

array([[12,  9,  6],

       [30, 23, 16],

       [48, 37, 26]])

>>> x= x.reshape(2,3)

>>> x

array([[1, 2, 3],

       [4, 5, 6]])

>>> x*y  # 按位置乘，要求两个矩阵shape相同

array([[ 6, 10, 12],

       [12, 10,  6]])

>>> x.T  # 二维矩阵的转置矩阵

array([[1, 4],

       [2, 5],

       [3, 6]])

>>> x.mean()  # 求平均值

3.5

关于下标的运算：（这些挺有意思的）

>>> a=np.array([5,4,3,233,9])

>>> a[np.array([2,4,3])]  # 列出对应下标的数值

array([  3,   9, 233])

>>> a>4

array([ True, False, False,  True,  True], dtype=bool)

>>> a[a>4]

array([  5, 233,   9])

>>> a[a>8]=8

>>> a

array([5, 4, 3, 8, 8])

>>> a.clip(4,5)  # 限定所有数据范围

array([5, 4, 4, 5, 5])

还有一个关于nan的

>>> a=np.array([1,2,0,3,4])

>>> a

array([1, 2, 0, 3, 4])

>>> b=np.array([1,2,np.NAN,3,4])

>>> b

array([  1.,   2.,  nan,   3.,   4.])  # 和a不同，虽然只改了一个nan，b每个数据后面有个“.”，说明变成float型了，说明nan其实是个float

>>> np.isnan(b)

array([False, False,  True, False, False], dtype=bool)

>>> b[~np.isnan(b)]

array([ 1.,  2.,  3.,  4.])

与系统自带array的差异

array的乘法

>>> [1,2,3,4,5]*2

[1, 2, 3, 4, 5, 1, 2, 3, 4, 5]

>>> [1,2,3,4,5]**2

(报错)

运行时间

对array和np.array进行按元素平方并求和的运算，运算3000次统计时间。

>>> timeit.timeit('sum(x*x for x in range(1000))',number=3000)

0.31559807779291305

>>> timeit.timeit('sum(na*na)', setup='import numpy as np; na=np.arange(1000)',number=3000)

0.37785958035067324

>>> timeit.timeit('na.dot(na)', setup='import numpy as np; na=np.arange(1000)',number=3000)

0.0069067372806728144

惊奇的发现系统级的array求和比np.array还快，说明np.array单个数据的访问还是比array较慢。但是用了矩阵乘法后，虽然效果一样，但这个速度就飞起来了。

[笔记]NumPy基础操作的更多相关文章

[学习笔记] Numpy基础系统学习
[学习笔记] Numpy基础上专业选修<数据分析程序设计>课程,老师串讲了Numpy基础,边听边用jupyter敲了下--理解+笔记. 老师讲的很全很系统,有些点没有记录,在PPT里就不 ...
numpy 基础操作
Numpy 基础操作¶ 以numpy的基本数据例子来学习numpy基本数据处理方法主要内容有: 创建数组数组维度转换数据选区和切片数组数据计算随机数数据合并数据统计计算 In [1]: ...
笔记-flask基础操作
笔记-flask基础操作 1. 前言本文为flask基础学习及操作笔记,主要内容为flask基础操作及相关代码. 2. 开发环境配置 2.1. 编译环境准备安装相关Lib ...
NumPy基础操作
NumPy基础操作(1) (注:记得在文件开头导入import numpy as np) 目录: 数组的创建强制类型转换与切片布尔型索引结语数组的创建相关函数 np.array(), np. ...
NumPy基础操作（3)——代数运算和随机数
NumPy基础操作(3)--代数运算和随机数 (注:记得在文件开头导入import numpy as np) 目录: NumPy在矩阵运算中的应用常用矩阵运算函数介绍编程实现利用NumPy生成随 ...
NumPy基础操作（2）
NumPy基础操作(2) (注:记得在文件开头导入import numpy as np) 目录: 写在前面转置和轴对换 NumPy常用函数写在前面本篇博文主要讲解了普通转置array.T.轴对换 ...
C#基础随手笔记之基础操作优化
对数据的查询,删除等基本操作是任何编程语言都会涉及到的基础,因此,研究了一下C#中比较常用的数据操作类型,并顺手做个笔记. List查询时,若是处理比较大的数据则使用HashSet<T>类 ...
[SQL] SQL学习笔记之基础操作
1 SQL介绍 SQL 是用于访问和处理数据库的标准的计算机语言.关于SQL的具体介绍,我们通过回答如下三个问题来进行. SQL 是什么? SQL,指结构化查询语言,全称是 Structured Qu ...
学习Numpy基础操作
# coding:utf-8 import numpy as np from numpy.linalg import * def day1(): ''' ndarray :return: ''' ls ...

随机推荐

《连载 | 物联网框架ServerSuperIO教程》- 17.支持实时数据库，高并发保存测点数据。附：3.4 发布与版本更新说明。
1.C#跨平台物联网通讯框架ServerSuperIO(SSIO)介绍 <连载 | 物联网框架ServerSuperIO教程>1.4种通讯模式机制. <连载 | 物联网框架Serve ...
java.lang.NoClassDefFoundError异常
1.错误信息 2.错误分析: JVM读到程序的第三行,会在当前路径 "D:\java" 下寻找com.yangquan.aolun这个包路径下的Cat类,但当前路径下根本就没有co ...
使用idea2017搭建SSM框架
搭建个SSM框架居然花费了我好长时间!特此记录! 需要准备的环境: idea 2017.1 jdk1.8 Maven 3.3.9 请提前将idea与Maven.jdk配置好,本次项目用的都是比较新的 ...
【C++】浅谈三大特性之一继承(三)
四,派生类的六个默认成员函数在继承关系里,如果我们没有显示的定义这六个成员函数,则编译系统会在适合场合为我们自动合成. 继承关系中构造函数和析构函数的调用顺序: class B { public: ...
Java基础之J2EE规范
什么是J2EE? 在企业级应用中,都有一些通用企业需求模块,如数据库连接,邮件服务,事务处理等.既然很多企业级应用都需要这些模块,一些大公司便开发了自己的通用模块服务,即中间件.这样一来,就避免了重复 ...
神奇的marquee--滚动的文字
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
JavaScript基础学习(六)—函数
一.函数的定义 1.function语句形式 //1.function语句式 function test1(){ alert("I am test1"); } test1(); 2 ...
Spark入门实战
星星之火,可以燎原 Spark简介 Spark是一个开源的计算框架平台,使用该平台,数据分析程序可自动分发到集群中的不同机器中,以解决大规模数据快速计算的问题,同时它还向上提供一个优雅的编程范式,使得 ...
iterable
iterable 阅读: 148111 遍历Array可以采用下标循环,遍历Map和Set就无法使用下标.为了统一集合类型,ES6标准引入了新的iterable类型,Array.Map和Set都属于i ...
1020. Tree Traversals
Suppose that all the keys in a binary tree are distinct positive integers. Given the postorder and i ...

[笔记]NumPy基础操作