数据类型操作##

如何改变Series/ DataFrame 对象###

  • 增加或重排:重新索引
  • 删除:drop

重新索引 .reindex()####

reindex() 能够改变或重排Series和DataFrame索引

d.reindex(['c5','c4','v3','v2','c1'])

这样是改变index的顺序

d.reindex(column=['同比',...]

这样是改变column的顺序

.reincdex() 的参数#####

index,columns 新的行列顺序

fill_value 重新索引中,用于填充缺失位置的值

method 填充方法,ffill 向前填充,bfill 向后填充

limit 最大填充量

copy 默认True,生成新的对象

  • 一个小例子,新增一列
newc=d.colimns.insert(4,'新增’)
newd=d.reindex(columns=newc,fill_value=200)
pandas 的索引类型(index)#####

.index .columns

index对象是一个不可修改的类型

+索引类型的常用操作

方法 说明
.append(ids) 链接另一个Index对象,产生新的Index对象
.diff(dix) 计算两个Index的差集
.intersection(dix) 计算两个Index的交集
.union() 计算两个Index的并集
.delete(loc) 删除loc位置的元素
.insert(loc,e) 在loc位置增加一个元素e

通过操作索引可以操作数据类型

删除指定索引对象####

a=pd.Series([9,8,7,6],index=['a','b','c','d'])

a.drop(['b','c'])

使用drop方法删除了这一部分数值(删除某一个index(row))

d.drop(['同比], axis=1) 这样给出axis就可以删除列了。

0 轴是操作index(row)

1 轴是操作column

pandas的数据类型运算###

Series DataFram算术运算face

根据行列索引运算,补齐后运算,运算默认产生浮点数

补齐时缺失项填充NAN

二维和一维 一维和0惟 间进行boradcast

采用+-*/符号时产生新的运算对象

  • 例子

    a=pd.DataFrame(np.arange(12).reshape(3,4))

    b=pd.DataFrame(np.arange(20).reshape(4,5))

    a+b 补齐的都是NAN

方法形式的运算####

方法 说明
.add(d,**argws) 类型间加法运算可选参数
.sub
.mul
.div

使用方法好处是可以增加可选参数

fill_value= 补齐的时候使用fill_value来补齐

一维默认在轴一(row)参与运算,

b中给的每一个index(row) 减去a

如果希望在零轴上 (column) b 中的每一个column减去 a

比较运算####

只比较相同索引的元素,不补齐

不同维度的boradcast 默认时1轴(每一个index(row) 都作用到a))上

Python数据分析与展示[第三周](pandas数据类型操作)的更多相关文章

  1. Python数据分析与展示[第三周](pandas简介与数据创建)

    第三周的课程pandas 分析数据 http://pandas.pydata.org import pandas as pd 常与numpy matplotlib 一块定义 d=pd.Series(r ...

  2. Python数据分析与展示[第三周](pandas数据特征分析单元8)

    数据理解 基本统计 分布/累计统计 数据特征 数据挖掘 数据排序 操作索引的排序 .sort_index() 在指定轴上排序,默认升序 参数 axis=0 column ascending=True ...

  3. python数据分析及展示(三)

    一.Pandas库入门 1. Pandas库的介绍 http://pandas.pydata.org Pandas是Python第三方库,提供高性能易用数据类型和分析工具 import pandas ...

  4. Python数据分析与展示第3周学习笔记(北京理工大学 嵩天等)

    入门学习马上结束辽. 1.Pandas库 import pandas as pd 两个数据类型:Series,DataFrame Series类型:数据+索引 自定义索引 b = pd.Series( ...

  5. Python数据分析与展示第2周学习笔记(北理工 嵩天)

    单元4:Matplotlib库入门 matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式 import matplotlib.pyplot as plt # -*- cod ...

  6. Python数据分析与挖掘所需的Pandas常用知识

    Python数据分析与挖掘所需的Pandas常用知识 前言Pandas基于两种数据类型:series与dataframe.一个series是一个一维的数据类型,其中每一个元素都有一个标签.series ...

  7. 【学习笔记】PYTHON数据分析与展示(北理工 嵩天)

    0 数据分析之前奏 课程主要内容:常用IDE:本课程主要使用:Anaconda Anaconda:一个集合,包括conda.某版本Python.一批第三方库等 -支持近800个第三方库 -适合科学计算 ...

  8. Python数据分析:手把手教你用Pandas生成可视化图表

    大家都知道,Matplotlib 是众多 Python 可视化包的鼻祖,也是Python最常用的标准可视化库,其功能非常强大,同时也非常复杂,想要搞明白并非易事.但自从Python进入3.0时代以后, ...

  9. Python 学习日记(第三周)

    知识回顾 在上一周的学习里,我学习了一些学习Python的基础知识下面先简短的回顾一些: 1Python的版本和和安装 Python的版本主要有2.x和3.x两个版本这两个版本在语法等方面有一定的区别 ...

随机推荐

  1. np一些基本操作2

    import numpy as nparr1 = np.arange(32).reshape(8,4)print(arr1)arr1 = arr1.reshape(-1);print(arr1)arr ...

  2. Centos7解决在同一局域网内无法使用ssh连接

    参考: https://www.cnblogs.com/liyuanhong/articles/5785368.html 一.修改网卡设置 nano /etc/sysconfig/network-sc ...

  3. __name__变量

    再写项目过程中,将功能函数写在 if  __name=="__main__":之外,执行代码写在之中,如下:如果在foo模块打印__name__为__main__,而如果在bin模 ...

  4. 深入浅出 Java Concurrency (2): 原子操作 part 1[转]

    从相对简单的Atomic入手(java.util.concurrent是基于Queue的并发包,而Queue,很多情况下使用到了Atomic操作,因此首先从这里开始).很多情况下我们只是需要一个简单的 ...

  5. Golang Learn Log #0

    Print/Printf 区别 Print: 可以打印出字符串, 和变量 fmt.Println(var) //right fmt.Println("string") //righ ...

  6. PAT甲级——A1039 Course List for Student

    Zhejiang University has 40000 students and provides 2500 courses. Now given the student name lists o ...

  7. Linux内核源码真是个好东西

    我突然发现,我是这么爱Linux内核源码.... 真幸福死了....   int vsprintf(char *buf, const char *fmt, va_list args)   这函数的实现 ...

  8. 垂直对齐:vertical-align属性——使用中注意事项

    1.vertical-align(垂直对齐),只对行内元素和单元格元素有效,例如属性为inline和inline-block的元素以及图片.输入表单等都是行内元素; 2.元素默认的垂直对齐方式为基线对 ...

  9. js 获取复选框 和 并改变状态

    function checkAll() { var checkbox = document.getElementById('vegeids');// var boxes = document.getE ...

  10. osg如何设置抗锯齿(反走样,反锯齿)

    首先抗锯齿是什么? 举个最简单的例子 你用windows画图软件画一根直线(准确说这个叫做线段),当水平或者垂直的时候,如下图,这是绝对完美的 但是当线段出现倾斜时,就无法做到完美了此时就会出现锯齿 ...