前情提要:

  数据分析:把一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究

对象的内在规律

  数据分析的三剑客: numpy,pandas,matplotlb

  

  numpy是python语言的一个扩展程序库,支持大量的维度数组与矩阵的运算

 ,此外,也针对数组的运算,提供了大量的数学函数库

一: 创建ndarray

 导包

import numpy as np

1: 创建数组 np.array()

  1=>1: 创建一个一维数组

np.array([1,2,3,4,5])

输出:
array([1, 2, 3, 4, 5])

  1=>2:创建一个二维数组

in:
np.array([[1,2,3],[4,'a',6],[6,7,8]]) out:
array([['1', '2', '3'],
['4', 'a', '6'],
['6', '7', '8']], dtype='<U11')

 

     注意: numpy的默认的ndarray的所有数据元素的类型是相同的.

         如果传进ladies列表中包含不同的类型,则统一为统一类型

      优先级:

        str>float>int

   2:使用np的routines函数创建

    包含以下常见创建方法:

      2=>1:

      np.ones(shape,dtype=None,order='c')   创建纯一的数组

  

in:
np.ones(shape=(3,3))
out: Out[9]:
array([[1., 1., 1.],
[1., 1., 1.],
[1., 1., 1.]])

      2=>2:

      np.zeros(shape,dtpye=None,order='c')  创建一个纯0的数组

in:
np.zeros(shape=(3,3)) out
array([[0., 0., 0.],
[0., 0., 0.],
[0., 0., 0.]])

     2=>3:

      np.full(shape,fill_value,dtype=None,order='c')  创建一个所有数字都一样的列表

in:
np.full(shape=(3,3),fill_value=100)
out:
array([[100, 100, 100],
[100, 100, 100],
[100, 100, 100]])

   2=>4:

      np.lispace(start,stop,num=50,endpoint=True. retstep=False, dtype=None)

      等差数列

    

np.linspace(1,100,num=20)

 
Out[19]:
array([  1.        ,   6.21052632,  11.42105263,  16.63157895,
21.84210526, 27.05263158, 32.26315789, 37.47368421,
42.68421053, 47.89473684, 53.10526316, 58.31578947,
63.52631579, 68.73684211, 73.94736842, 79.15789474,
84.36842105, 89.57894737, 94.78947368, 100. ])

    2=>5: 

    np.arange(0,100,step=2)

 

  2=>6: 产生随机的整数

  np.random.randint(low,high=None,size=None,dtype='l')

  

  2=>7: 标准正太分布

  二: ndarray的属性

  4个必计参数:ndim ; 维度  shape :形状 (各维度的长度) size :总长度

  dtype :元素类型

      ndim  维度

  

    size :总长度

   dtype  数据类型

  三:  ndarray的基本操作

1 :索引

一维与列表完全一致 多维时同理

根据索引修改数据

2 切片

一维与列表完全一致 多维时同理

      样本数据

2=>1: 获取前两行

2=>2: 获取前两列

2=>3:获取前两列的前两行

2=>4: 行倒序

2:=>5: 列倒序

2=>6: 全部倒序

 3 变形 

使用arr.reshape(),注意参数是一个元组 

 基本使用

  1.将一维数组变成多维数组,或多维数组变成以为数组

1=>1 :一变多

 

 1=>2:多变一:

 

 

 

 

4: 级联

np.concatenate()

 

注意: axis=0 轴像

0 表示 竖直方向,

1 表示水平方向

 

 

相同轴像的数据维度要相同

5 切分: 

与级联类似,三个函数完成切分工作:

np.split(arr,行/列号,轴):参数2是一个列表类型

 

 

 注意: axis=1 的时候为竖着切 ,0为横着切

 

 

四: ndarray的聚合操作

五 广播机制

ndarray广播机制的三条规则:缺失维度的数组将维度补充为进行运算的数组的维度。缺失的数组元素使用已有元素进行补充。

  • 规则一:为缺失的维度补1(进行运算的两个数组之间的维度只能相差一个维度)
  • 规则二:缺失元素用已有值填充
  • 规则三:缺失维度的数组只能有一行或者一列

例子1 :

数据分析相关学习 -1 numpy的更多相关文章

  1. 数据分析之Pandas和Numpy学习笔记(持续更新)<1>

    pandas and numpy notebook        最近工作交接,整理电脑资料时看到了之前的基于Jupyter学习数据分析相关模块学习笔记.想着拿出来分享一下,可是Jupyter导出来h ...

  2. python数据分析入门学习笔记

    学习利用python进行数据分析的笔记&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分 ...

  3. 动态可视化 数据可视化之魅D3,Processing,pandas数据分析,科学计算包Numpy,可视化包Matplotlib,Matlab语言可视化的工作,Matlab没有指针和引用是个大问题

    动态可视化 数据可视化之魅D3,Processing,pandas数据分析,科学计算包Numpy,可视化包Matplotlib,Matlab语言可视化的工作,Matlab没有指针和引用是个大问题 D3 ...

  4. python数据分析入门学习笔记儿

    学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据 ...

  5. python数据分析---第04章 NumPy基础:数组和矢量计算

    NumPy(Numerical Python的简称)是Python数值计算最重要的基础包.大多数提供科学计算的包都是用NumPy的数组作为构建基础. NumPy的部分功能如下: ndarray,一个具 ...

  6. [学习笔记] Numpy基础 系统学习

    [学习笔记] Numpy基础 上专业选修<数据分析程序设计>课程,老师串讲了Numpy基础,边听边用jupyter敲了下--理解+笔记. 老师讲的很全很系统,有些点没有记录,在PPT里就不 ...

  7. 数论算法 剩余系相关 学习笔记 (基础回顾,(ex)CRT,(ex)lucas,(ex)BSGS,原根与指标入门,高次剩余,Miller_Rabin+Pollard_Rho)

    注:转载本文须标明出处. 原文链接https://www.cnblogs.com/zhouzhendong/p/Number-theory.html 数论算法 剩余系相关 学习笔记 (基础回顾,(ex ...

  8. Oracle OCI操作UDT相关学习(二)

    沿用 Oracle OCI操作UDT相关学习 一文中定义的类型和表. 1.更改数据 在sqldeveloper 中更新数据, update dxl.cust set addr.street='a11' ...

  9. ReentrantLock 相关学习笔记

    ReentrantLock 相关学习笔记 标签(空格分隔): Java多线程 Java接口Lock有三个实现类:ReentrantLock.ReentrantReadWriteLock.ReadLoc ...

随机推荐

  1. Core使用SAP Web Service

    .Net Core在使用SAP的Web Service会遭遇到一些错误,貌似目前并不支持SAP中的Web Service,我们需要曲线实现下调用过程: 经测试,不再需要Framework项目中转,Sy ...

  2. react-router 5.0 的鉴权

    react-router 5.0 的鉴权 当我们使用react-router 控制页面的路由时候,有些页面,是需要登录才能访问,有些不需要登录就可以访问,还有些页面,是根据用户的权限来限制访问的. 如 ...

  3. Yet Another Problem On a Subsequence CodeForces - 1000D (组合计数)

    大意:定义一个长为$k>1$且首项为$k-1$的区间为好区间. 定义一个能划分为若干个好区间的序列为好序列. 给定序列$a$, 求有多少个子序列为好序列. 刚开始一直没想出来怎么避免重复计数, ...

  4. 【转载】使用appium遇到的坑

    问题 1. error: Failed to start an Appium session, err was: Error: Requested a new session but one was ...

  5. 三种TCP协议聊天室实现

    一 概述 使用Java的IO实现聊天室 使用Java的NIO实现聊天室 使用Netty实现聊天室 二 IO聊天室 1 服务器 public class IOServer { public static ...

  6. WebSocket协议探究(二)

    一 复习和目标 1 复习 协议概述: WebSocket内置消息定界并且全双工通信 WebSocket使用HTTP进行协议协商,协商成功使用TCP连接进行传输数据 WebScoket数据格式支持二进制 ...

  7. VBA Excel宏(二)

    在本章中,我们来学习如何逐步编写一个简单的宏. 第1步 - 首先,在Excel 2016中启用“开发者”菜单.要完成这个设置,请点击左上角菜单:文件 -> 选项.如下图所示 - 第2步 - 点击 ...

  8. React/数据流

    “Props” 当 React 元素为用户自定义组件时,它会将 JSX 所接收的属性(attributes)转换为单个对象传递给组件,这个对象被称之为 “props”. props的只读性 组件无论是 ...

  9. linux centos安装nginx1.7.4

    原文转自 jerryhe326:https://www.cnblogs.com/jerrypro/p/7062101.html一.安装准备 首先由于nginx的一些模块依赖一些lib库,所以在安装ng ...

  10. 优秀技术Leader应具备的六项能力

    技术Leader是互联网公司中,战斗在一线的技术领导者,技术Leader们能力的强弱,决定着公司整个技术团队的战斗力,结合我之前管理上百人技术团队的经验,谈谈我心目中优秀技术Leader五个方面的能力 ...