一  : 安装ipython以及用到的包介绍

 # 这里我们会用到ipython解释器,本文代码在ipython下运行

 Pip3 install ipython

 Pip3 install jupyter

 Jupyter notebook

 Pandas  是我们数据分析的核心包
 pandas相当于是表数据
 Series相当于表数据的一列

 Dropna()  : 过滤掉为nan的行

 iloc 是下标   df[0,1]  # 两个都是下标
 Loc 是标签   df.loc[df.index[0], 'close']        # 两个都是标签
             #例子中是知道一个索引,将索引变成标签

 多维:
     - Df.dropna(how='all')    删除单列全是nan的
     - Df.dropna(axis=1)          #x=1找行 ,  x=1找列


二: 关于numpy

 import numpy as np

 # astype
 In [7]:
 arr = np.array([1.2,2.3,3.4])
 arr.astype('int')
 arr

 arr1 = arr.astype('int')
 arr1
 Out[7]:
 array([1, 2, 3])
 In [ ]:

 # eye 矩阵
 In [12]:
 np.eye(6)
 Out[12]:
 array([[ 1.,  0.,  0.,  0.,  0.,  0.],
        [ 0.,  1.,  0.,  0.,  0.,  0.],
        [ 0.,  0.,  1.,  0.,  0.,  0.],
        [ 0.,  0.,  0.,  1.,  0.,  0.],
        [ 0.,  0.,  0.,  0.,  1.,  0.],
        [ 0.,  0.,  0.,  0.,  0.,  1.]])

 In [14]:

 import random

 l = [random.randint(1,10) for i in range(0,20)]
 l
 Out[14]:
 [2, 6, 3, 5, 1, 5, 7, 5, 10, 7, 2, 7, 4, 8, 2, 2, 3, 1, 5, 2]
 In [17]:
 arr = np.array(l)
 arr

 Out[17]:
 array([ 2,  6,  3,  5,  1,  5,  7,  5, 10,  7,  2,  7,  4,  8,  2,  2,  3,
         1,  5,  2])

 In [18]:
 list(filter(lambda x:x>5,l))
 Out[18]:
 [6, 7, 10, 7, 7, 8]

 In [19]:
 arr.T
 Out[19]:
 array([ 2,  6,  3,  5,  1,  5,  7,  5, 10,  7,  2,  7,  4,  8,  2,  2,  3,
         1,  5,  2])

 In [20]:
 arr.size
 Out[20]:
 20

 In [21]:
 arr.ndim
 Out[21]:
 1

 In [30]:
 arr=np.array([1.2,2.3,3.8,5,6])
 arr
 Out[30]:
 array([ 1.2,  2.3,  3.8,  5. ,  6. ])

 In [31]:
 arr.astype('int')
 Out[31]:
 array([1, 2, 3, 5, 6])

 In [34]:
 # 花式索引
 arr = np.array(l)
 arr
 Out[34]:
 array([ 2,  6,  3,  5,  1,  5,  7,  5, 10,  7,  2,  7,  4,  8,  2,  2,  3,
         1,  5,  2])

 In [36]:
 # 花式索引
 arr[[1,3,5,7,9]]
 Out[36]:
 array([6, 5, 5, 5, 7])

 In [37]:
 # 花式索引
 arr[np.arange(0,arr.size,2)]
 Out[37]:
 array([ 2,  3,  1,  7, 10,  2,  4,  2,  3,  5])

 In [45]:
 '''
 ceil : 向上取整           3.1-->4    -3.1 --> -3
 floor : 向下取整   取小    3.1-->3    3.9-->3
 rint(round) : 四舍五入    3.6--> 4   3.1-->3   找最近的数
 trunc(int) : 向零取整(舍去小数点后)
 modf : 将整数和小数分开
 maximun  相同位置取最大
 minimum  相反
 '''

 arr = np.arange(10)
 arr.sum()
 arr.mean()    # 平均数
 arr.cumsum()  # 前缀和

 Out[45]:
 array([ 0,  1,  3,  6, 10, 15, 21, 28, 36, 45])

 In [43]:
 # var : 方差, 表示这组输的离散程度
 arr.var()         数越小越集中
 Out[43]:
 8.25

 In [44]:
 # std : 标准差
 arr.std()
 Out[44]:
 2.8722813232690143

 # uniform : 对应randint  小数
 # np.random.rand()  0到1 的随机小数

 In [47]:
 l = [1,2,3,4,5]
 random.shuffle(l)  # 洗牌
 l
 Out[47]:
 [5, 3, 4, 1, 2]

 np.random.randint(-10,10,5) # -10到10之间的随机整数 拿5个

 In [*]:
 np.random.randint(-10,10,(3,5)) # -10到10之间的随机整数 拿5个

Numpy的更多相关文章

  1. 《机器学习实战-KNN》—如何在cmd命令提示符下运行numpy和matplotlib

    问题背景:好吧,文章标题是瞎取得.平常用cmd运行python代码问题不大,我在学习<机器学习实战>这本书时,发现cmd无法运行import numpy as np以及import mat ...

  2. 机器学习实战笔记(Python实现)-08-线性回归

    --------------------------------------------------------------------------------------- 本系列文章为<机器 ...

  3. 机器学习实战笔记(Python实现)-04-Logistic回归

    --------------------------------------------------------------------------------------- 本系列文章为<机器 ...

  4. 机器学习实战笔记(Python实现)-03-朴素贝叶斯

    --------------------------------------------------------------------------------------- 本系列文章为<机器 ...

  5. 机器学习实战笔记(Python实现)-01-K近邻算法(KNN)

    --------------------------------------------------------------------------------------- 本系列文章为<机器 ...

  6. 《机器学习实战》学习笔记——第13章 PCA

    1. 降维技术 1.1 降维的必要性 1. 多重共线性--预测变量之间相互关联.多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯.2. 高维空间本身具有稀疏性.一维正态分布有68%的值落于正负 ...

  7. 机器学习实战 - 读书笔记(14) - 利用SVD简化数据

    前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第14章 - 利用SVD简化数据. 这里介绍,机器学习中的降维技术,可简化样品数据. 基 ...

  8. 机器学习实战 - 读书笔记(13) - 利用PCA来简化数据

    前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第13章 - 利用PCA来简化数据. 这里介绍,机器学习中的降维技术,可简化样品数据. ...

  9. 机器学习实战笔记5(logistic回归)

    1:简单概念描写叙述 如果如今有一些数据点,我们用一条直线对这些点进行拟合(改线称为最佳拟合直线),这个拟合过程就称为回归.训练分类器就是为了寻找最佳拟合參数,使用的是最优化算法. 基于sigmoid ...

  10. K近邻 Python实现 机器学习实战(Machine Learning in Action)

    算法原理 K近邻是机器学习中常见的分类方法之间,也是相对最简单的一种分类方法,属于监督学习范畴.其实K近邻并没有显式的学习过程,它的学习过程就是测试过程.K近邻思想很简单:先给你一个训练数据集D,包括 ...

随机推荐

  1. 51nod 1058 N的阶乘的长度 位数公式

    1058 N的阶乘的长度基准时间限制:1 秒 空间限制:131072 KB 分值: 0 难度:基础题 收藏 关注输入N求N的阶乘的10进制表示的长度.例如6! = 720,长度为3.Input输入N( ...

  2. hdu 2669 Romantic 扩展欧几里得

    Now tell you two nonnegative integer a and b. Find the nonnegative integer X and integer Y to satisf ...

  3. PHP魔术方法和魔术变量总结

    从php5以后的版本,类就可以使用魔术方法了.PHP规定以两个下划线开头的方法都保留为魔术方法,所以建议大家函数名最好不用__开 头,除非是为了重载已有的魔术方法. 目前php已有的魔术方法有 __c ...

  4. Dynamics CRM可以设置会话超时和非活动超时吗?

    本人微信和易信公众号: 微软动态CRM专家罗勇 ,回复266或者20171213可方便获取本文,同时可以在第一间得到我发布的最新的博文信息,follow me!我的网站是 www.luoyong.me ...

  5. 利用模板template动态渲染jsp页面

    一.场景 在js中写html简直是噩梦,刚进新公司,在codereview的时候得知可以通过将html模板写在jsp页面,然后由js调取模板,利用replace()方法替换传值的方式避免在js中拼接h ...

  6. Springboot学习记录1--概念介绍以及环境搭建

    摘要:springboot学习记录,环境搭建: 官方文档地址:https://docs.spring.io/spring-boot/docs/current-SNAPSHOT/reference/ht ...

  7. L贪心基础

    <span style="color:#330099;">/* L - 贪心 基础 Time Limit:1000MS Memory Limit:65536KB 64b ...

  8. Ubuntu1204 vim中文乱码解决方法

    加入中文字符编码 sudo vi /var/lib/locales/supported.d/local #加入以下的中文字符集 zh_CN.GBK GBK zh_CN.GB2312 GB2312 zh ...

  9. 页面输入的数据格式转换类:BaseAction(经常使用于Struts框架中)

    在我们接收页面传来的数据时,这些数据都是以String类型接收的,所以要进行数据格式转换,这时候就能够统一为它们进行转换,并且在处理这些数据的类中能够继承ActionSupport类,然后让每个接收数 ...

  10. Proactor 学习1

    Proactor    An Object Behavioral Pattern for Demultiplexingand Dispatching Handlers for Asynchronous ...