一、numpy概述

NumPy是高性能科学计算和数据分析的基础包。它是pandas等其他各种工具的基础。

NumPy的主要功能:

  • ndarray,一个多维数组结构,高效且节省空间
  • 无需循环对整组数据进行快速运算的数学函数
  • *读写磁盘数据的工具以及用于操作内存映射文件的工具
  • *线性代数、随机数生成和傅里叶变换功能
  • *用于集成C、C++等代码的工具

python中操作方式:

  • 安装方法:pip install numpy
  • 引用方式:import numpy as np

也可以通过安装anaconda软件操作,里面包含(numpy,pandas以及Matplotlib多个库),本片文章是在anaconda3中运行!!!

二、NumPy:ndarray-多维数组对象

创建ndarray:np.array()

ndarray是多维数组,与列表的区别是:

  • 数组对象内的元素类型必须相同
  • 数组大小不可修改

常用属性:

  • T            数组的转置(对高维数组而言)
  • dtype     数组元素的数据类型
  • size       数组元素的个数
  • ndim      数组的维数
  • shape    数组的维度大小(以元组形式)

代码示例:

三、NumPy:ndarray-数据类型

ndarray数据类型:dtype:
●布尔型:bool_
●整型:int_ int8 int16 int32 int64
●无符号整型:uint8 uint16 uint32 uint64
●浮点型:float_ float16 float32 float64
●复数型:complex_ complex64 complex128

四、NumPy:ndarray-创建

创建ndarray:
●array() 将列表转换为数组,可选择显式指定dtype
●arange() range的numpy版,支持浮点数
●linspace() 类似arange(),第三个参数为数组长度
●zeros() 根据指定形状和dtype创建全0数组
●ones() 根据指定形状和dtype创建全1数组
●empty() 根据指定形状和dtype创建空数组(随机值)

五、NumPy:索引和切片

  -代码示例:
  ●a= np.array([0,1,2,3,4,5,6,7,8,9])
  ●a2 = np.array([[0,1,2,3,4],[5,6,7,8,9],[10,11,12,13,14]]) -数组和标量之间的运算
●a+1 a*3 1//a a**0.5
-同样大小数组之间的运算
●a+b a/b a**b
-数组的索引
●一维数组:a[5] --> #5
●多维数组:
●列表式写法:a2[2][3] --> #13
●新式写法:a2[2,3](推荐) --> #13
-数组的切片
●一维数组:a[5:8]   --> # array([5,6,7])  
a[:3] = 1 --> # array([1,1,1,3,4,5,6,7,8,9])
●二维数组:a2[1:2, :4] --> # array([[5, 6, 7, 8]])  
a2[:,:1] --> # array([[0],[5],[10]])
       a2[:,1] --> # array([1,6,11])
-与列表不同,数组切片时并不会自动复制,在切片数组上的修改会影响原数组。
●【解决方法: copy()】

六、NumPy:布尔型索引

问题:给一个数组,选出数组中所有大于5的数。
答案:a[a>5]
原理:
a>5会对a中的每一个元素进行判断,返回一个布尔数组
布尔型索引:将同样大小的布尔数组传进索引,会返回一个由所有True对应位置的元素的数组 问题2:给一个数组,选出数组中所有大于5的偶数。
答案:
a[(a>5) & (a%2==0)]
原理:此处不能用and,and为关键字;&为运算符,表示与的意思 问题3:给一个数组,选出数组中所有大于5的数或偶数。
答案:
a[(a>5) | (a%2==0)]
原理:此处 | 表示或的意思 备注:~表示非的意思

 七NumPy:花式索引*

问题1:对于一个数组,选出其第1,3,4,6,7个元素,组成新的二维数组。
●答案:a[[1,3,4,6,7]] 问题2:对一个二维数组,选出其第一列和第三列,组成新的二维数组。
●答案:a[:,[1,3]] 问题3: 已知 a2 = np.array([[0,1,2,3,4],[5,6,7,8,9],[10,11,12,13,14]]),想要获取新的数组array([[1,3],[11,13]])该怎么切?
●答案: a2[[0,2],:][:,[1,3]]
●备注:切勿两边同时花式索引,a2[[0,2],[1,3]],得出 array([ 1, 13])

八、NumPy:通用函数

通用函数:能同时对数组中所有元素进行运算的函数

九、NumPy:数学和统计方法

常用函数:
●sum 求和
●mean 求平均数
●std 求标准差
●var 求方差
●min 求最小值
●max 求最大值
●argmin 求最小值索引
●argmax 求最大值索引

十、NumPy:随机数生成

常用函数
●rand 给定形状产生随机数组(0到1之间的数)
●randint 给定形状产生随机整数
●choice 给定形状产生随机选择
●shuffle 与random.shuffle相同
●uniform 给定形状产生随机数组

数据分析--numpy的基本使用的更多相关文章

  1. 利用Python进行数据分析——Numpy基础:数组和矢量计算

    利用Python进行数据分析--Numpy基础:数组和矢量计算 ndarry,一个具有矢量运算和复杂广播能力快速节省空间的多维数组 对整组数据进行快速运算的标准数学函数,无需for-loop 用于读写 ...

  2. Python数据分析-Numpy数值计算

    Numpy介绍: NumPy是高性能科学计算和数据分析的基础包.它是pandas等其他各种工具的基础. NumPy的主要功能: 1)ndarray,一个多维数组结构,高效且节省空间 2)无需循环对整组 ...

  3. Python数据分析numpy库

    1.简介 Numpy库是进行数据分析的基础库,panda库就是基于Numpy库的,在计算多维数组与大型数组方面使用最广,还提供多个函数操作起来效率也高 2.Numpy库的安装 linux(Ubuntu ...

  4. 数据分析——numpy

    DIKW DATA-->INFOMATION-->KNOWLEDGE-->WISDOM 数据-->信息-->知识-->智慧 爬虫-->数据库-->数据分 ...

  5. Python数据分析Numpy库方法简介(二)

    数据分析图片保存:vg 1.保存图片:plt.savefig(path) 2.图片格式:jpg,png,svg(建议使用,不失真) 3.数据存储格式: excle,csv csv介绍 csv就是用逗号 ...

  6. python数据分析Numpy(二)

    Numpy (Numerical Python) 高性能科学计算和数据分析的基础包: ndarray,多维数组(矩阵),具有矢量运算能力,快速.节省空间: 矩阵运算,无需循环,可以完成类似Matlab ...

  7. python 数据分析----numpy

    NumPy是高性能科学计算和数据分析的基础包.它是pandas等其他各种工具的基础. NumPy的主要功能: ndarray,一个多维数组结构,高效且节省空间 无需循环对整组数据进行快速运算的数学函数 ...

  8. 数据分析 - Numpy

    简介 Numpy是高性能科学计算和数据分析的基础包.它也是pandas等其他数据分析的工具的基础,基本所有数据分析的包都用过它.NumPy为Python带来了真正的多维数组功能,并且提供了丰富的函数库 ...

  9. 数据分析-numpy的用法

    一.jupyter notebook 两种安装和启动的方式: 第一种方式: 命令行安装:pip install jupyter 启动:cmd 中输入 jupyter notebook 缺点:必须手动去 ...

随机推荐

  1. unity shader之预备知识

    1.渲染流水线 任务:从一个三维场景出发,生成(或者渲染)一张二维图像.即:计算机需要从一系列的定点出数据,纹理等信息出发,把这些信息最终转换程一张人眼可以看到的图像.而这个工作通常是由CPU和GPU ...

  2. [Mysql] GroupBy 分组,按天、周、月

    简单说明: 最近在做报表功能的时候,需要将数据按天.周和月进行合并展示(数据记录都是按天20190701). 正文: 说明:数据表中date都是int类型:如 20190701 一.按天 SELECT ...

  3. 海量数据搜索---demo展示百度、谷歌搜索引擎的实现

    在我们平常的生活工作中,百度.谷歌这些搜索网站已经成为了我们受教解惑的学校,俗话说得好,“有问题找度娘”.那么百度是如何在海量数据中找到自己需要的数据呢?为什么它搜索的速度如此之快?我们都知道是因为百 ...

  4. 洛谷P1169 [ZJOI2007]棋盘制作 悬线法 动态规划

    P1169 [ZJOI2007]棋盘制作 (逼着自己做DP 题意: 给定一个包含0,1的矩阵,求出一个面积最大的正方形矩阵和长方形矩阵,要求矩阵中相邻两个的值不同. 思路: 悬线法. 用途: 解决给定 ...

  5. POJ-1222EXTENDED LIGHTS OUT-位运算枚举模板

    传送门:http://poj.org/problem?id=1222 题意:开关灯问题,一幅开关的灯中,给出一种操作,使得灯全关掉,(操作一个开关,相邻的灯也会改变) 思路:利用位运算枚举第一行: # ...

  6. Codeforces 416D Population Size

    Population Size 题意: 一共n个数, 每个-1都可以变成一个正数, 现在要求最少数目的等差子序列,并且在这个子序列必须要连着截取一段,不能分开截取. 样例1: 8 6 4 2 1 4 ...

  7. lightoj 1030-B - Discovering Gold (概率dp)

    题意:有一个直线的金矿,每个点有一定数量的金子:你从0开始,每次扔个骰子,扔出几点就走几步, 然后把那个点的金子拿走:如果扔出的骰子超出了金矿,就重新扔,知道你站在最后一个点:问拿走金 子的期望值是多 ...

  8. 修改,编译,GDB调试openjdk8源码(docker环境下)

    在上一章<在docker上编译openjdk8>里,我们在docker容器内成功编译了openjdk8的源码,有没有读者朋友产生过这个念头:"能不能修改openjdk源码,构建一 ...

  9. spark与mapreduce的区别

    spark是通过借鉴Hadoop mapreduce发展而来,继承了其分布式并行计算的优点,并改进了mapreduce明显的缺陷,具体表现在以下几方面: 1.spark把中间计算结果存放在内存中,减少 ...

  10. 【Offer】[18-1] 【在O(1)时间内删除链表节点】

    题目描述 思路分析 测试用例 代码链接 题目描述 给定单向链表的头指针和一个结点指针,定义一个函数在O(1)时间删除该结点. 思路分析 一般我们删除单链表中的节点是需要遍历链表,找到要删除节点的前一个 ...