数据分析--numpy的基本使用
一、numpy概述
NumPy是高性能科学计算和数据分析的基础包。它是pandas等其他各种工具的基础。
NumPy的主要功能:
- ndarray,一个多维数组结构,高效且节省空间
- 无需循环对整组数据进行快速运算的数学函数
- *读写磁盘数据的工具以及用于操作内存映射文件的工具
- *线性代数、随机数生成和傅里叶变换功能
- *用于集成C、C++等代码的工具
python中操作方式:
- 安装方法:pip install numpy
- 引用方式:import numpy as np
也可以通过安装anaconda软件操作,里面包含(numpy,pandas以及Matplotlib多个库),本片文章是在anaconda3中运行!!!
- anaconda下载地址请戳:https://www.anaconda.com/download/
- anaconda安装及创建项目教程:https://jingyan.baidu.com/article/3f16e0031e87522591c10320.html
二、NumPy:ndarray-多维数组对象
创建ndarray:np.array()
ndarray是多维数组,与列表的区别是:
- 数组对象内的元素类型必须相同
- 数组大小不可修改
常用属性:
- T 数组的转置(对高维数组而言)
- dtype 数组元素的数据类型
- size 数组元素的个数
- ndim 数组的维数
- shape 数组的维度大小(以元组形式)
代码示例:
三、NumPy:ndarray-数据类型
ndarray数据类型:dtype:
●布尔型:bool_
●整型:int_ int8 int16 int32 int64
●无符号整型:uint8 uint16 uint32 uint64
●浮点型:float_ float16 float32 float64
●复数型:complex_ complex64 complex128
四、NumPy:ndarray-创建
创建ndarray:
●array() 将列表转换为数组,可选择显式指定dtype
●arange() range的numpy版,支持浮点数
●linspace() 类似arange(),第三个参数为数组长度
●zeros() 根据指定形状和dtype创建全0数组
●ones() 根据指定形状和dtype创建全1数组
●empty() 根据指定形状和dtype创建空数组(随机值)
五、NumPy:索引和切片
-代码示例:
●a= np.array([0,1,2,3,4,5,6,7,8,9])
●a2 = np.array([[0,1,2,3,4],[5,6,7,8,9],[10,11,12,13,14]]) -数组和标量之间的运算
●a+1 a*3 1//a a**0.5
-同样大小数组之间的运算
●a+b a/b a**b
-数组的索引
●一维数组:a[5] --> #5
●多维数组:
●列表式写法:a2[2][3] --> #13
●新式写法:a2[2,3](推荐) --> #13
-数组的切片
●一维数组:a[5:8] --> # array([5,6,7])
a[:3] = 1 --> # array([1,1,1,3,4,5,6,7,8,9])
●二维数组:a2[1:2, :4] --> # array([[5, 6, 7, 8]])
a2[:,:1] --> # array([[0],[5],[10]])
a2[:,1] --> # array([1,6,11])
-与列表不同,数组切片时并不会自动复制,在切片数组上的修改会影响原数组。
●【解决方法: copy()】
六、NumPy:布尔型索引
问题:给一个数组,选出数组中所有大于5的数。
答案:a[a>5]
原理:
a>5会对a中的每一个元素进行判断,返回一个布尔数组
布尔型索引:将同样大小的布尔数组传进索引,会返回一个由所有True对应位置的元素的数组 问题2:给一个数组,选出数组中所有大于5的偶数。
答案:
a[(a>5) & (a%2==0)]
原理:此处不能用and,and为关键字;&为运算符,表示与的意思 问题3:给一个数组,选出数组中所有大于5的数或偶数。
答案:
a[(a>5) | (a%2==0)]
原理:此处 | 表示或的意思 备注:~表示非的意思
七、NumPy:花式索引*
问题1:对于一个数组,选出其第1,3,4,6,7个元素,组成新的二维数组。
●答案:a[[1,3,4,6,7]] 问题2:对一个二维数组,选出其第一列和第三列,组成新的二维数组。
●答案:a[:,[1,3]] 问题3: 已知 a2 = np.array([[0,1,2,3,4],[5,6,7,8,9],[10,11,12,13,14]]),想要获取新的数组array([[1,3],[11,13]])该怎么切?
●答案: a2[[0,2],:][:,[1,3]]
●备注:切勿两边同时花式索引,a2[[0,2],[1,3]],得出 array([ 1, 13])
八、NumPy:通用函数
通用函数:能同时对数组中所有元素进行运算的函数
九、NumPy:数学和统计方法
常用函数:
●sum 求和
●mean 求平均数
●std 求标准差
●var 求方差
●min 求最小值
●max 求最大值
●argmin 求最小值索引
●argmax 求最大值索引
十、NumPy:随机数生成
常用函数
●rand 给定形状产生随机数组(0到1之间的数)
●randint 给定形状产生随机整数
●choice 给定形状产生随机选择
●shuffle 与random.shuffle相同
●uniform 给定形状产生随机数组
数据分析--numpy的基本使用的更多相关文章
- 利用Python进行数据分析——Numpy基础:数组和矢量计算
利用Python进行数据分析--Numpy基础:数组和矢量计算 ndarry,一个具有矢量运算和复杂广播能力快速节省空间的多维数组 对整组数据进行快速运算的标准数学函数,无需for-loop 用于读写 ...
- Python数据分析-Numpy数值计算
Numpy介绍: NumPy是高性能科学计算和数据分析的基础包.它是pandas等其他各种工具的基础. NumPy的主要功能: 1)ndarray,一个多维数组结构,高效且节省空间 2)无需循环对整组 ...
- Python数据分析numpy库
1.简介 Numpy库是进行数据分析的基础库,panda库就是基于Numpy库的,在计算多维数组与大型数组方面使用最广,还提供多个函数操作起来效率也高 2.Numpy库的安装 linux(Ubuntu ...
- 数据分析——numpy
DIKW DATA-->INFOMATION-->KNOWLEDGE-->WISDOM 数据-->信息-->知识-->智慧 爬虫-->数据库-->数据分 ...
- Python数据分析Numpy库方法简介(二)
数据分析图片保存:vg 1.保存图片:plt.savefig(path) 2.图片格式:jpg,png,svg(建议使用,不失真) 3.数据存储格式: excle,csv csv介绍 csv就是用逗号 ...
- python数据分析Numpy(二)
Numpy (Numerical Python) 高性能科学计算和数据分析的基础包: ndarray,多维数组(矩阵),具有矢量运算能力,快速.节省空间: 矩阵运算,无需循环,可以完成类似Matlab ...
- python 数据分析----numpy
NumPy是高性能科学计算和数据分析的基础包.它是pandas等其他各种工具的基础. NumPy的主要功能: ndarray,一个多维数组结构,高效且节省空间 无需循环对整组数据进行快速运算的数学函数 ...
- 数据分析 - Numpy
简介 Numpy是高性能科学计算和数据分析的基础包.它也是pandas等其他数据分析的工具的基础,基本所有数据分析的包都用过它.NumPy为Python带来了真正的多维数组功能,并且提供了丰富的函数库 ...
- 数据分析-numpy的用法
一.jupyter notebook 两种安装和启动的方式: 第一种方式: 命令行安装:pip install jupyter 启动:cmd 中输入 jupyter notebook 缺点:必须手动去 ...
随机推荐
- Selenium3 + Python3自动化测试系列十——调用JavaScript代码
调用JavaScript代码 一.调用JavaScript代码方法 Selenium在对浏览器操作时会有自动化代码中不稳定的部分,经常出错的部分,可以将这部分对网页元素进行操作的代码换成对应的Java ...
- 解决ionic 启动页面图片没有显示及启动页出现黑白屏
1.ionic 正确打包完app, 并且按照正常的步骤配置config.xml文件之后 ,启动页面还是不能正常的显示出来,而是黑了一下之后,就进入首页了 原因很有可能就是你没有装cordova-plu ...
- Javaweb Cookie机制
Javaweb Cookie机制 一.前言 HTTP协议是一种无状态的协议,WEB服务器本身不能识别出哪些请求是同一个浏览器发出的 ,浏览器的每一次请求都是完全孤立的,即使 HTTP1.1 支持持续连 ...
- 超越Storm,SparkStreaming——Flink如何实现有状态的计算
流式计算分为无状态和有状态两种情况.无状态计算观察每个独立的事件,Storm就是无状态的计算框架,每一条消息来了以后和前后都没有关系,一条是一条.比如我们接收电力系统传感器的数据,当电压超过240v就 ...
- Worker Service in ASP .NET Core
介绍 提到 ASP.NET Core,我们多半会想到 ASP.NET MVC.ASP.NET Web API.Razor page 及 Blazor.随着 .NET Core 3.0 的推出,今天会介 ...
- 2019 ICPC南京网络预选赛 I Washing clothes 李超线段树
题意:有n个人,每个人有一件衣服需要洗,可以自己手洗花费t时间,也可以用洗衣机洗,但是洗衣机只有一台,即每个时刻最多只能有·一个人用洗衣机洗衣服.现在给你每个人最早可以开始洗衣服的时间,问当洗衣机的洗 ...
- 左偏树 P3377【模板】左偏树(可并堆)
题目传送门 代码: /* code by: zstu wxk time: 2019/03/01 */ #include<bits/stdc++.h> using namespace std ...
- Codeforces Round #381 (Div. 2) C. Alyona and mex(无语)
题目链接 http://codeforces.com/contest/740/problem/C 题意:有一串数字,给你m个区间求每一个区间内不含有的最小的数,输出全部中最小的那个尽量使得这个最小值最 ...
- uiautomator2 实现App九宫格解锁
App九宫格解锁 之前在testerhome社区看见codeskyblue大佬写过一种方法,但是这种办法存在一个弊端,那就是多个点的坐标是写死的,也就是说要是换了部手机,九宫格解锁就行不通了,于是就想 ...
- 【Windows】PostgreSql安装
Installer安装包问题 Problem running post-install step. Installation may not complete correctly. The datab ...