Python数据分析与展示[第三周]（pandas数据类型操作）

sfzyk 2024-09-08 10:40:12 原文

数据类型操作##

如何改变Series/ DataFrame 对象###

增加或重排：重新索引
删除：drop

重新索引 .reindex()####

reindex() 能够改变或重排Series和DataFrame索引

d.reindex(['c5','c4','v3','v2','c1'])

这样是改变index的顺序

d.reindex(column=['同比',...]

这样是改变column的顺序

.reincdex() 的参数#####

index,columns 新的行列顺序

fill_value 重新索引中，用于填充缺失位置的值

method 填充方法，ffill 向前填充,bfill 向后填充

limit 最大填充量

copy 默认True，生成新的对象

一个小例子，新增一列

newc=d.colimns.insert(4,'新增’)
newd=d.reindex(columns=newc,fill_value=200)

pandas 的索引类型（index)#####

.index .columns

index对象是一个不可修改的类型

+索引类型的常用操作

方法	说明
.append(ids)	链接另一个Index对象，产生新的Index对象
.diff(dix)	计算两个Index的差集
.intersection(dix)	计算两个Index的交集
.union()	计算两个Index的并集
.delete(loc)	删除loc位置的元素
.insert(loc,e)	在loc位置增加一个元素e

通过操作索引可以操作数据类型

删除指定索引对象####

a=pd.Series([9,8,7,6],index=['a','b','c','d'])

a.drop(['b','c'])

使用drop方法删除了这一部分数值(删除某一个index(row))

d.drop(['同比], axis=1) 这样给出axis就可以删除列了。

0 轴是操作index(row)

1 轴是操作column

pandas的数据类型运算###

Series DataFram算术运算face

根据行列索引运算，补齐后运算，运算默认产生浮点数

补齐时缺失项填充NAN

二维和一维一维和0惟间进行boradcast

采用+-*/符号时产生新的运算对象

例子

a=pd.DataFrame(np.arange(12).reshape(3,4))

b=pd.DataFrame(np.arange(20).reshape(4,5))

a+b 补齐的都是NAN

方法形式的运算####

方法	说明
.add(d,**argws)	类型间加法运算可选参数
.sub
.mul
.div

使用方法好处是可以增加可选参数

fill_value= 补齐的时候使用fill_value来补齐

一维默认在轴一(row)参与运算,

b中给的每一个index(row) 减去a

如果希望在零轴上 (column) b 中的每一个column减去 a

比较运算####

只比较相同索引的元素,不补齐

不同维度的boradcast 默认时1轴（每一个index（row) 都作用到a))上

Python数据分析与展示[第三周]（pandas数据类型操作）的更多相关文章

Python数据分析与展示[第三周]（pandas简介与数据创建）
第三周的课程pandas 分析数据 http://pandas.pydata.org import pandas as pd 常与numpy matplotlib 一块定义 d=pd.Series(r ...
Python数据分析与展示[第三周]（pandas数据特征分析单元8）
数据理解基本统计分布/累计统计数据特征数据挖掘数据排序操作索引的排序 .sort_index() 在指定轴上排序,默认升序参数 axis=0 column ascending=True ...
python数据分析及展示（三）
一.Pandas库入门 1. Pandas库的介绍 http://pandas.pydata.org Pandas是Python第三方库,提供高性能易用数据类型和分析工具 import pandas ...
Python数据分析与展示第3周学习笔记（北京理工大学嵩天等）
入门学习马上结束辽. 1.Pandas库 import pandas as pd 两个数据类型:Series,DataFrame Series类型:数据+索引自定义索引 b = pd.Series( ...
Python数据分析与展示第2周学习笔记（北理工嵩天）
单元4:Matplotlib库入门 matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式 import matplotlib.pyplot as plt # -*- cod ...
Python数据分析与挖掘所需的Pandas常用知识
Python数据分析与挖掘所需的Pandas常用知识前言Pandas基于两种数据类型:series与dataframe.一个series是一个一维的数据类型,其中每一个元素都有一个标签.series ...
【学习笔记】PYTHON数据分析与展示(北理工嵩天)
0 数据分析之前奏课程主要内容:常用IDE:本课程主要使用:Anaconda Anaconda:一个集合,包括conda.某版本Python.一批第三方库等 -支持近800个第三方库 -适合科学计算 ...
Python数据分析：手把手教你用Pandas生成可视化图表
大家都知道,Matplotlib 是众多 Python 可视化包的鼻祖,也是Python最常用的标准可视化库,其功能非常强大,同时也非常复杂,想要搞明白并非易事.但自从Python进入3.0时代以后, ...
Python 学习日记（第三周）
知识回顾在上一周的学习里,我学习了一些学习Python的基础知识下面先简短的回顾一些: 1Python的版本和和安装 Python的版本主要有2.x和3.x两个版本这两个版本在语法等方面有一定的区别 ...

随机推荐

java连接SQLserver数据库模板代码
package cn.mldn.lxh.dbc; import java.sql.Connection; import java.sql.DriverManager; public class Dat ...
springBoot 项目 jar/war打包并运行
一:idea 打jar 包简述:springboor 项目最好的打包方式就是打成jar ,下边就是简单的过程 1.打开idea工具 ,选着要打开的项目, 然后打开view--> too ...
[转]WPF焦点概述
WPF 中,有两个与焦点有关的主要概念:键盘焦点和逻辑焦点. 键盘焦点指接收键盘输入的元素,而逻辑焦点指焦点范围中具有焦点的元素. 本概述将详细介绍这些概念. 理解这些概念之间的区别对于创建具有可以获 ...
C++项目使用的开源库记录
日志库:log4cplus 网络库:libcurl xml库:tinyxml 多媒体库:lib555 视频解码库:ffmpeg 用opencv的VideoCapture类可以直接打开rtsp视频,所以 ...
redhat linux卸载自带的Java1.4.2安装JDK6
一.卸载jdk1.4 由于Redhat Enterprise Linux 5.6 中自带安装了jdk1.4.2的,所以在安装jdk1.6前我把jdk1.4.2的卸了,步骤如下: 1.打开终端输入 yu ...
Filter - 全局编码 (装饰者模式)
Tomcat7以前需要处理get乱码,tomcat8以后不需要处理get乱码,因为tomcat内部会处理. 乱码原因: package cn.itcast.web.filter; import jav ...
MyBatis配置文件(三)－－typeAliases别名
因为类的全限定名一般包括包名,显得很长,在使用过程中不是很方便,所以MyBatis中允许我们使用一种简写的方式来代替全限定名,这就是别名.这就相当于我们在玩微信的时候,有些人的昵称很长很难记,怎么办? ...
AGC035D
AGC035D Add and Remove 题意给出\(n\)个数,每次删除一个不在两端的数,然后把它的权值加到相邻的两个数上. 问操作\(n-2\)次后,所剩的两数之和的最小值 \(n\le18 ...
Java 函数优雅之道
导读随着软件项目代码的日积月累,系统维护成本变得越来越高,是所有软件团队面临的共同问题.持续地优化代码,提高代码的质量,是提升系统生命力的有效手段之一.软件系统思维有句话“Less coding, ...
Django项目：CRM(客户关系管理系统)--30--22PerfectCRM实现King_admin数据添加
登陆密码设置参考 http://www.cnblogs.com/ujq3/p/8553784.html # king_urls.py # ————————02PerfectCRM创建ADMIN页面—— ...