Numpy

  Numpy 是 Python 数据科学计算的核心库,提供了高性能的多维数组对象及处理数组的工具

使用方式

import numpy as np

数组

生成数组

 简单生成

a = np.array([1, 2, 3])
# <class 'numpy.ndarray'>
# [1 2 3] a = np.array([1, '2', 3]) # 取值为字符串
# <class 'numpy.ndarray'>
# ['1' '2' '3'] a = np.array([1, 2.0, 3]) # 取值去float
# <class 'numpy.ndarray'>
# [1. 2. 3.] 

dtype类型

a = np.array([1, 2.0, 3],dtype=np.str)
# <class 'numpy.ndarray'>
# ['1' '2.0' '3'] # 其他类型
# np.int64 带符号的64位整数
# np.float32 标准双精度浮点数
# np.complex 显示为128位浮点数的复数
# np.bool 布尔值:True值和False值
# np.object Python对象
# np.string_ 固定长度字符串
# np.unicode_ 固定长度Unicode

copy参数

# copy参数   默认True
a = np.array([1, '2', 3])
b = np.array(a, copy=True)
c = np.array(a, copy=False)
# 635743528800
# 635743684528
# 635743528800

初始化占位符

# 3行4列
a = np.zeros((3, 4))
# <class 'numpy.ndarray'>
# [[0. 0. 0. 0.]
# [0. 0. 0. 0.]
# [0. 0. 0. 0.]] # 2行3列4纵
a = np.ones((2, 3, 4,2), dtype=np.int16)
# <class 'numpy.ndarray'>
# [[[1 1 1 1]
# [1 1 1 1]
# [1 1 1 1]]
#
# [[1 1 1 1]
# [1 1 1 1]
# [1 1 1 1]]] # 创建均匀间隔的数组(步进值)
a = np.arange(10, 25, 5)
# <class 'numpy.ndarray'>
# [10 15 20] # 创建均匀间隔的数组(样本数)
a = np.linspace(0, 2, 9)
# <class 'numpy.ndarray'>
# [0. 0.25 0.5 0.75 1. 1.25 1.5 1.75 2. ] # 创建常数数组
a = np.full((2,2),7)
# <class 'numpy.ndarray'>
# [[7 7]
# [7 7]] # 创建2x2单位矩阵
a = np.eye(2)
# <class 'numpy.ndarray'>
# [[1. 0.]
# [0. 1.]] # 创建随机值的数组
a = np.random.random((2,2))
# <class 'numpy.ndarray'>
# [[0.43922179 0.48453874]
# [0.753194 0.09264839]] # 创建空数组
a = np.empty((3,2))
# <class 'numpy.ndarray'>
# [[1.39069238e-309 1.39069238e-309]
# [1.39069238e-309 1.39069238e-309]
# [1.39069238e-309 1.39069238e-309]]

输入输出

保存/读取

# 保存为npy文件
a = np.full((10,10),7)
# 保存
np.save('my_array', a)
# 读取
np.load('my_array.npy') # 保存文本文档
np.savetxt("myarray.txt", a, delimiter=",")
# 读取
np.loadtxt("myarray.txt")
# 读取excel
np.genfromtxt("my_fle.csv", delimiter=',')

数组信息

a = np.zeros((3, 4))
# [[0. 0. 0. 0.]
# [0. 0. 0. 0.]
# [0. 0. 0. 0.]] # 数组形状,几行几列
print(a.shape)
# (3, 4) # 数组长度
print(len(a))
# 3 # 几维数组
print(a.ndim)
# 2 # 数组有多少元素
print(a.size)
# 12 # 数据类型
print(a.dtype)
# float64 # 数据类型的名字
print(a.dtype.name)
# float64 # 数据类型转换
print(a.astype(int))
# [[0 0 0 0]
# [0 0 0 0]
# [0 0 0 0]]

  

索引、切片、比较

切片

import numpy as np

matrix = np.array([
[5, 10, 15],
[20, 25, 30],
[35, 40, 45]
]) # 取所有行的第2列
print(matrix[:,1])
# [10 25 40] # 取所有行的前1、2列
print(matrix[:,0:2])
# [[ 5 10]
# [20 25]
# [35 40]] # 取2、3行的前1、2列
print(matrix[1:3,0:2])
# [[20 25]
# [35 40]]

比较

import numpy as np

# 获取比较结果
matrix = np.array([
[5, 10, 15],
[20, 25, 30],
[35, 40, 45]
])
print(matrix == 25)
# [[False False False]
# [False True False]
# [False False False]] # 根据比较结果取值
vector = np.array([5, 10, 15, 20])
equal_to_ten = (vector == 10)
print(equal_to_ten)
print(vector[equal_to_ten])
# [False True False False]
# [10] # 根据比较结果切片取值
matrix = np.array([
[5, 10, 15],
[20, 25, 30],
[35, 40, 45]
])
second_column_25 = (matrix[:,1] == 25)
print(second_column_25)
print(matrix[second_column_25, :])
# [False True False]
# [[20 25 30]] # 与操作 去比较结果
vector = np.array([5, 10, 15, 20])
equal_to_ten_and_five = (vector == 10) & (vector == 5)
print(equal_to_ten_and_five)
# [False False False False] # 或操作 去比较结果
vector = np.array([5, 10, 15, 20])
equal_to_ten_or_five = (vector == 10) | (vector == 5)
print(equal_to_ten_or_five)
# [ True True False False] # 根据比较结果赋值
vector = np.array([5, 10, 15, 20])
equal_to_ten_or_five = (vector == 10) | (vector == 5)
vector[equal_to_ten_or_five] = 50
print(vector)
# [50 50 15 20]

数组计算

聚合函数

# 数据汇总
vector = np.array([5, 10, 15, 20])
print(vector.sum())
# 50 # 二维矩阵汇总
matrix = np.array([
[5, 10, 15],
[20, 25, 30],
[35, 40, 45]
])
print(matrix.sum())
# 225 # 二维横向汇总
print(matrix.sum(axis=1))
# [ 30 75 120] # 二维竖向汇总
print(matrix.sum(axis=0))
# [60 75 90]

数组运算

a = np.array([20, 30, 40, 50])
b = np.arange(4)
print(a)
print(b)
# [20 30 40 50]
# [0 1 2 3] # 减
c = a - b
print(c)
# [20 29 38 47] # 加
c = a + b
print(c)
# [20 31 42 53] # 乘
c = a * b
print(c)
# [ 0 30 80 150] # 除
c = b / a
print(c)
# [0. 0.03333333 0.05 0.06 ] # 2次幂
print(b**2)
# [0 1 4 9] # 点积 https://www.jianshu.com/p/482abac8798c
A = np.array( [[1,1],
[0,1]] )
B = np.array( [[2,0],
[3,4]] )
print(A)
print(B)
print(A.dot(B))
print(np.dot(A, B))
# [[1 1]
# [0 1]]
# [[2 0]
# [3 4]]
# [[5 4]
# [3 4]]
# [[5 4]
# [3 4]] import numpy as np
B = np.arange(3)
print(B)
# [0 1 2] # 幂
print(np.exp(B))
# [1. 2.71828183 7.3890561 ] # 平方根
print(np.sqrt(B))
# [0. 1. 1.41421356]

数组操作

import numpy as np

# floor向下取整
a = np.floor(10*np.random.random((3,4)))
print(a)
# [[1. 5. 3. 3.]
# [3. 3. 2. 6.]
# [4. 9. 5. 3.]] # ravel合为一行
print(a.ravel())
# [1. 5. 3. 3. 3. 3. 2. 6. 4. 9. 5. 3.] # 更换shape形状
a.shape = (6, 2)
print(a)
# [[1. 5.]
# [3. 3.]
# [3. 3.]
# [2. 6.]
# [4. 9.]
# [5. 3.]] # 横竖转换
print(a.T)
# [[1. 3. 3. 2. 4. 5.]
# [5. 3. 3. 6. 9. 3.]] # -1 默认值
print(a.reshape(3,-1))
# [[1. 5. 3. 3.]
# [3. 3. 2. 6.]
# [4. 9. 5. 3.]] # 拼接
a = np.floor(10*np.random.random((2,2)))
b = np.floor(10*np.random.random((2,2)))
print(a)
# [[5. 7.]
# [2. 9.]]
print(b)
# [[7. 4.]
# [7. 7.]]
print(np.hstack((a,b))) # 横向拼接
# [[5. 7. 7. 4.]
# [2. 9. 7. 7.]]
print(np.vstack((a,b))) # 纵向拼接
# [[5. 7.]
# [2. 9.]
# [7. 4.]
# [7. 7.]] # 分割
a = np.floor(10*np.random.random((2,12)))
print(a)
# [[4. 7. 8. 2. 0. 1. 5. 7. 1. 2. 1. 2.]
# [5. 8. 9. 2. 5. 5. 8. 9. 5. 4. 7. 8.]] print(np.hsplit(a,3)) # 横向切割3份
# [array([[4., 7., 8., 2.],
# [5., 8., 9., 2.]]), array([[0., 1., 5., 7.],
# [5., 5., 8., 9.]]), array([[1., 2., 1., 2.],
# [5., 4., 7., 8.]])] print(np.vsplit(a,2)) # 纵向切割3份
# [array([[4., 7., 8., 2., 0., 1., 5., 7., 1., 2., 1., 2.]]), array([[5., 8., 9., 2., 5., 5., 8., 9., 5., 4., 7., 8.]])] print(np.hsplit(a,(3,4))) # 横向切割3,4
# [array([[9., 3., 0.],
# [1., 0., 4.]]), array([[7.],
# [5.]]), array([[8., 5., 7., 7., 4., 9., 8., 2.],
# [6., 7., 6., 4., 9., 5., 9., 3.]])]

拷贝

# 赋值
a = np.arange(12)
b = a
# a and b are two names for the same ndarray object
# b is a
# True
b.shape = 3,4
print(a.shape)
print(id(a))
print(id(b))
# (3, 4)
# 115753432
# 115753432 # 浅拷贝
c = a.view()
# c is a
# Flase
c.shape = 2,6
#print a.shape
c[0,4] = 1234
print(a)
# [[ 0 1 2 3]
# [1234 5 6 7]
# [ 8 9 10 11]] # 深拷贝
d = a.copy()
# d is a
# Flase
d[0,0] = 9999
print(d)
print(a)
# [[9999 1 2 3]
# [1234 5 6 7]
# [ 8 9 10 11]]
# [[ 0 1 2 3]
# [1234 5 6 7]
# [ 8 9 10 11]]

  

 

机器学习【工具】:Numpy基础的更多相关文章

  1. 【Numpy】python机器学习包Numpy基础知识学习

    一.安装:在之前的博客中已经写过:http://www.cnblogs.com/puyangsky/p/4763234.html 二.python数组切片知识: python中序列类有list.str ...

  2. 机器学习- Numpy基础 吐血整理

    Numpy是专门为数据科学或者数据处理相关的需求设计的一个高效的组件.听起来是不是挺绕口的,其实简单来说就2个方面,一是Numpy是专门处理数据的,二是Numpy在处理数据方面很牛逼(肯定比Pytho ...

  3. 《利用python进行数据分析》读书笔记--第四章 numpy基础:数组和矢量计算

    http://www.cnblogs.com/batteryhp/p/5000104.html 第四章 Numpy基础:数组和矢量计算 第一部分:numpy的ndarray:一种多维数组对象 实话说, ...

  4. 你不得不看的Python机器学习工具

    IEEE Spectrum排行榜第一,Skill UP排名第一的开发工具,Stack Overflow年度调查中程序员最感兴趣的选择,Stack Overflow 6月份访问量最多的编程语言..... ...

  5. 科学计算工具-Numpy初探

    Numpy基础数据结构 Numpy数组是一个多维数组,称为ndarray.其由两部分组成: 实际的数据 描述这些数据的原数据 导入该库: import numpy as np 多维数组ndarray ...

  6. 利用Python进行数据分析——Numpy基础:数组和矢量计算

    利用Python进行数据分析--Numpy基础:数组和矢量计算 ndarry,一个具有矢量运算和复杂广播能力快速节省空间的多维数组 对整组数据进行快速运算的标准数学函数,无需for-loop 用于读写 ...

  7. 微软开源自动机器学习工具NNI安装与使用

    微软开源自动机器学习工具 – NNI安装与使用   在机器学习建模时,除了准备数据,最耗时耗力的就是尝试各种超参组合,找到最佳模型的过程了.对于初学者来说,常常是无从下手.即使是对于有经验的算法工程师 ...

  8. NumPy 基础用法

    NumPy 是高性能科学计算和数据分析的基础包. 它是 pandas 等其他各种工具的基础. 主要功能: ndarray 一个多维数组结构, 高效且节省空间 无需循环对整组数据进行快速运算的数学函数 ...

  9. 机器学习---笔记----Python基础

    一. python简介 1. python 具有丰富强大的库,常被称为胶水语言,能够把用其他语言制作的各种模块很轻松地联结在一起 2. python强制使用空白符(white space)作为语句缩进 ...

  10. [转]python与numpy基础

    来源于:https://github.com/HanXiaoyang/python-and-numpy-tutorial/blob/master/python-numpy-tutorial.ipynb ...

随机推荐

  1. 执行start-dfs.sh后,datenode没有启动的解决办法

    执行start-dfs.sh后,datenode没有启动,很大一部分原因是因为在第一次格式化dfs后,启动并使用了hadoop,后来又重新执行了格式化命令(hdfs namenode -format) ...

  2. HttpWebRequest - Asynchronous Programming Model/Task.Factory.FromAsyc

    Posted by Shiv Kumar on 23rd February, 2011 The Asynchronous Programming Model (or APM) has been aro ...

  3. 第四百零一节,Django+Xadmin打造上线标准的在线教育平台—生产环境部署virtualenv虚拟环境安装,与Python虚拟环境批量安装模块

    第四百零一节,Django+Xadmin打造上线标准的在线教育平台—生产环境部署virtualenv虚拟环境安装,与Python虚拟环境批量安装模块 virtualenv简介 1.安装virtuale ...

  4. Spring Java-based容器配置

    多年以来,Spring大量的XML配置及复杂的依赖管理饱受非议. 为了实现免XML的开发体验.Spring加入了新的配置注解以支持Java Config开发模式,当中最重要的注解就是@Configur ...

  5. 微信小程序中使用Async-await方法异步请求变为同步请求

    微信小程序中有些 Api 是异步的,无法直接进行同步处理.例如:wx.request.wx.showToast.wx.showLoading等.如果需要同步处理,可以使用如下方法: 注意: Async ...

  6. [PHP] 02 - Namespace & Class

    两个比较大的话题,独立成本篇. 面向对象编程 一.命名空间 PHP 命名空间可以解决以下两类问题: 用户编写的代码与PHP内部的类/函数/常量或第三方类/函数/常量之间的名字冲突. 为很长的标识符名称 ...

  7. linux下WEB服务器安装、配置VSFTP

    转载  http://www.oicto.com/centos-vsftp/?tdsourcetag=s_pcqq_aiomsg linux下WEB服务器安装.配置VSFTP 由 admin · 发布 ...

  8. C# 如何提取字符串中的数字

    下面讲解如何在字符串当中抓取到数字 方法一.使用正则表达式 1.纯数字提取 string str = "提取123abc提取"; //我们抓取当前字符当中的123 string r ...

  9. modbus ASCII和MODBUS RTU区别

    下表是MODBUS ASCII协议和RTU协议的比较: 协议 开始标记 结束标记 校验 传输效率 程序处理 ASCII :(冒号) CR,LF LRC 低 直观,简单,易调试 RTU 无 无 CRC ...

  10. 英文写作强调技巧:alliteration, assonance, consonance

    alliteration 安排两个以上首字母相同的词相邻 例: The bouncing ball went high into the sky. (In this example, the &quo ...