Pandas之csv文件对列行的相关操作

1.Pandas对数据某一列删除

1.删除列

import pandas as pd

df = pd.read_csv(file)

#axis=1就是删除列

df.drop(['列名1','列名2'], axis=1)

2.删除记录，也就是行

import pandas as pd

df = pd.read_csv(file)

#axis=0就是删除记录也就是行

df.drop([0,1,3], axis=0)

2.Pandas之修改列名

1.第一种是没有表头，想要添加表头

因为csv文件是没有表头的，但是默认会把第一行作为表头，而实际上可能第一行就是我们的数据，不能够丢失。

所以要做read_csv函数参数加上header=None，然后再进行保存文件，这样系统就会加上0,1这样的表头了，再次打开，就可以使用rename函数进行表头的更改了。

import pandas as pd

data2 = pd.read_csv('D:/transpond_data_1.csv')

data2.head()

Out：

	0	1

0	mrMzW0lLIA	0

1	mqJrVB2hb6	0

2	m7nJFCgLiK	0

3	mSFZpU8qVB	0

4	mjBQVsjogW	0

上面这个已经是保存后的有表头的文件了，可以看到就是0,1默认。

df = pd.DataFrame(data2)

df = df.rename(columns={'0':'mid_c','1':'num'})

print(df)

Out：

              mid_c  num

0        mrMzW0lLIA    0

1        mqJrVB2hb6    0

2        m7nJFCgLiK    0

3        mSFZpU8qVB    0

4        mjBQVsjogW    0

...             ...  ...

1619147  mdO38FApFD    0

1619148  mNlc2caNpk    0

1619149  mkbybukSaa    0

1619150  mTStAdjFQt    0

1619151  mA3atazmJ6    0

最后再进行保存文件

df = pd.DataFrame(df,columns=['mid_c','num'])

print(df)

df.to_csv('D:\\transpond_data.csv',index=False,encoding='utf-8')

已经改成功了。

2.第二种是有表头直接进行改表头

可以直接打开文件，进行rename函数的使用，最后进行保存，省去了没有表头，进行系统默认添加表头这一步。

3.pandas操作csv多个列，生成新的列

import pandas as pd

df = pd.read_csv(file)

df.eval('new1 = 气温 + 湿度 + PM2P5' , inplace=True)

#inplace这个参数表示是否在原数据上进行操作

这样new1这一列就是通过该文件中的其他几列通过运算得出的新列，直接添加在该文件上。

df.query("age==24")

这样就可以把列age中等于24的选出来了。

#注意：query后面只支持string形式的值，而‘age’==24返回的是一个bool类型，结果不是true就是false，所以需要进行如上操作"age==24"，才可返回正确结果

4.pandas去除文件中的重复项

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset : column label or sequence of labels, optional

用来指定特定的列，默认所有列
keep : {‘first’, ‘last’, False}, default ‘first’

删除重复项并保留第一次出现的项
inplace : boolean, default False

是直接在原来数据上修改还是保留一个副本

df.drop_duplicates('B','first',inplace = True)

#表示删除B列中重复的项，first保留第一次出现的项，在原数据上进行操作。

5.pandas之拼接函数merge()

pandas中的merge()函数类似于SQL中join的用法，可以将不同数据集依照某些字段（属性）进行合并操作，得到一个新的数据集。
用法

DataFrame1.merge(DataFrame2, how=‘inner’, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=(’_x’, ‘_y’))

参数	说明

how	默认为inner，可设为inner/outer/left/right

on	根据某个字段进行连接，必须存在于两个DateFrame中（若未同时存在，则需要分别使用left_on和right_on来设置）

left_on	左连接，以DataFrame1中用作连接键的列

right_on	右连接，以DataFrame2中用作连接键的列

left_index	将DataFrame1行索引用作连接键

right_index	将DataFrame2行索引用作连接键

sort	根据连接键对合并后的数据进行排列，默认为True

suffixes	对两个数据集中出现的重复列，新数据集中加上后缀_x,_y进行区别

用例

#利用字典dict创建数据框

dataDf1=pd.DataFrame({'lkey':['foo','bar','baz','foo'],

                     'value':[1,2,3,4]})

dataDf2=pd.DataFrame({'rkey':['foo','bar','qux','bar'],

                     'value':[5,6,7,8]})

print(dataDf1)

print(dataDf2)

>>>

  lkey  value

0  foo      1

1  bar      2

2  baz      3

3  foo      4

  rkey  value

0  foo      5

1  bar      6

2  qux      7

3  bar      8

#inner链接

dataLfDf=dataDf1.merge(dataDf2, left_on='lkey',right_on='rkey')

>>>

  lkey  value_x rkey  value_y

0  foo        1  foo        5

1  foo        4  foo        5

2  bar        2  bar        6

3  bar        2  bar        8

#Right链接

dataDf1.merge(dataDf2, left_on='lkey', right_on='rkey',how='right')

>>>

  lkey  value_x rkey  value_y

0  foo      1.0  foo        5

1  foo      4.0  foo        5

2  bar      2.0  bar        6

3  bar      2.0  bar        8

4  NaN      NaN  qux        7

#Outer链接

dataDf1.merge(dataDf2, left_on='lkey', right_on='rkey', how='outer')

>>>

  lkey  value_x rkey  value_y

0  foo      1.0  foo      5.0

1  foo      4.0  foo      5.0

2  bar      2.0  bar      6.0

3  bar      2.0  bar      8.0

4  baz      3.0  NaN      NaN

5  NaN      NaN  qux      7.0

Pandas之csv文件对列行的相关操作的更多相关文章

理解CSV文件以及ABAP中的相关操作
在很多ABAP开发中,我们使用CSV文件,有时候,关于CSV文件本身的一些问题使人迷惑.它仅仅是一种被逗号分割的文本文档吗? 让我们先来看看接下来可能要处理的几个相关组件的词汇的语义. Separat ...
使用Pandas读取CSV文件
使用Pandas读取CSV文件 import pandas as pd csv_data = pd.read_csv('birth_weight.csv') # 读取训练数据 print(csv_da ...
使用pandas读取csv文件和写入文件
这是我的CSV文件读取其中得tempo这一列 import pandas as pd #导入pandas包 data = pd.read_csv("E:\\毕设\\情感识别\\Music- ...
pandas 读csv文件 TypeError: Empty 'DataFrame': no numeric data to plot
简单的代码,利用pandas模块读csv数据文件,这里有两种方式,一种是被新版本pandas遗弃的Series.from_csv:另一种就是pandas.read_csv 先说一下问题这个问题就是在读 ...
使用pandas导入csv文件到MySQL
之前尝试过用命令行来解决csv文件导入到MySQL这个问题,没想到一直没有成功.之后会继续更新的吧,现在先用pandas来解决这个问题,虽然会复杂一点,但至少能用. 例子是导入movielens的ra ...
Oracle数据库导入csv文件(sqlldr命令行)
1.说明 Oracle数据库导入csv文件, 当csv文件较小时, 可以使用数据库管理工具, 比如DBevaer导入到数据库, 当csv文件很大时, 可以使用Oracle提供的sqlldr命令行工具, ...
[Python]-pandas模块-CSV文件读写
Pandas 即Python Data Analysis Library,是为了解决数据分析而创建的第三方工具,它不仅提供了丰富的数据模型,而且支持多种文件格式处理,包括CSV.HDF5.HTML 等 ...
pandas读取csv文件中文乱码问题
1.为什么会出现乱码问题,用什么方式编码就用什么方式解码,由于csv不是用的utf-8编码,故不能用它解码. 常用的编码方式有 utf-8,ISO-8859-1.GB18030等. 2.中文乱码原因: ...
php生成csv文件并提供下载及相关注意事项
1.生成文件过程略,只要逗号分割就可以了 2.提供下载加上如下代码: header("Content-type: application/octet-stream"); heade ...

随机推荐

c++小学期大作业攻略（五）基于QSS的样式美化
这回真的是最后一篇了. 前面说过,我们开发过程中暂时不搭理样式问题,等最后再一起处理,那么现在就是最后处理时刻了!看到网上说QSS跟CSS差不多,我还觉得自己可以干回老本行了,结果用起来发现,QSS是 ...
scala中val和var的区别
1:内容是否可变:val修饰的是不可变的,var修饰是可变的 2:val修饰的变量在编译后类似于java中的中的变量被final修饰 3:lazy修饰符可以修饰变量,但是这个变量必须是val修饰的 p ...
使“Cmder Here”菜单在Tab页开新窗口
Cmder是一个非常好用的的控制台命令行,我们在实际使用的时候,经常通过如下指令将其注册到右键菜单: Cmder.exe /REGISTER ALL 这样就可以在任意文件夹下快速打开Cmder,并且能 ...
Reactor的NIO线程模型
1.Reactor单线程模型传统的javaNIO通信的线程模型.该线程模型仅有一个I/O线程处理所有的I/O操作,如下图: 单线程模型的Reactor 所有的客户端都连接到一个I/O线程负责的A ...
.Net Core部署Linux系统（CentOS7.6）
.net core版本:2.2 Linux:CentOS 7.6 所需工具: Xshell 6 + Xftp 6 第一步:在Startup类中加入这两行代码然后本地发布项目: 第二步,安装.Net ...
好用到哭！8个技巧让Vim菜鸟变专家
原文: https://juejin.im/post/5da68cb8f265da5b8c03c4a1 Vim只不过是一个文本编辑器,但如果你曾见过真正的高手是如何使用vim的,你就会知道,这个软件出 ...
Git 版本及版本范围表示法
很多 Git 命令都使用 revision(修订版本)作为参数.根据不同的命令,有时候 revision 参数代表一个特定的提交,有时候代表某一个提交可以追踪到的所有的父提交(比如 git log) ...
python机器学习简介
目录一:学习机器学习原因和能够解决的问题二:为什么选择python作为机器学习的语言三:机器学习常用库简介四:机器学习流程机器学习是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析 ...
uni-app通过判断接口403跳转登录页面的问题
需求: 当向后端请求接口返回 403 的时候,直接跳到登录页面让用户登录实现方案: 在请求结束后拦截器中判断,如果是 403 就跳转遇到难题: 一级页面(我的) onShow() 中有接口请求,用 ...
（原+修改）Pip使用国内源安装opencv
转载请注明出处: https://www.cnblogs.com/darkknightzh/p/12000823.html 参考网址: https://www.imooc.com/article/34 ...

Pandas之csv文件对列行的相关操作

1.Pandas对数据某一列删除

2.Pandas之修改列名

3.pandas操作csv多个列，生成新的列

4.pandas去除文件中的重复项

5.pandas之拼接函数merge()

Pandas之csv文件对列行的相关操作的更多相关文章

随机推荐

热门专题