Pandas 合并 concat

pandas处理多组数据的时候往往会要用到数据的合并处理,使用 concat是一种基本的合并方式.而且concat中有很多参数可以调整,合并成你想要的数据形式.

1、axis(合并方向)：axis=0是预设值，因此未设定任何参数时，函数默认axis=0。

>>> import pandas as pd

>>> import numpy as np

#定义资料集

>>> df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])

>>> df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

>>> df3 = pd.DataFrame(np.ones((3,4))*2, columns=['a','b','c','d'])

#concat纵向合并

>>> res = pd.concat([df1, df2, df3], axis=0)

>>> print(res)

     a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

0  1.0  1.0  1.0  1.0

1  1.0  1.0  1.0  1.0

2  1.0  1.0  1.0  1.0

0  2.0  2.0  2.0  2.0

1  2.0  2.0  2.0  2.0

2  2.0  2.0  2.0  2.0

仔细观察会发现结果的index是0, 1, 2, 0, 1, 2, 0, 1, 2，若要将index重置，请看下面。

2、ignore——index(重置index)

#承上一个例子，并将index_ignore设定为True

>>> res = pd.concat([df1, df2, df3], axis=0, ignore_index=True)

>>> print(res)

     a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

3  1.0  1.0  1.0  1.0

4  1.0  1.0  1.0  1.0

5  1.0  1.0  1.0  1.0

6  2.0  2.0  2.0  2.0

7  2.0  2.0  2.0  2.0

8  2.0  2.0  2.0  2.0

结果的index变0, 1, 2, 3, 4, 5, 6, 7, 8。

3、join(合并方式)

join='outer'为预设值，因此未设定任何参数时，函数默认join='outer'。此方式是依照column来做纵向合并，有相同的column上下合并在一起，其他独自的column个自成列，原本没有值的位置皆以NaN填充。

>>> import pandas as pd

>>> import numpy as np

>>> df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'], index=[1,2,3])

>>> df2 = pd.DataFrame(np.ones((3,4))*1, columns=['b','c','d','e'], index=[2,3,4])

#纵向"外"合并df1与df2

>>> res = pd.concat([df1, df2], axis=0, join='outer')

>>> print(res)

     a    b    c    d    e

1  0.0  0.0  0.0  0.0  NaN

2  0.0  0.0  0.0  0.0  NaN

3  0.0  0.0  0.0  0.0  NaN

2  NaN  1.0  1.0  1.0  1.0

3  NaN  1.0  1.0  1.0  1.0

4  NaN  1.0  1.0  1.0  1.0

#原理同上个例子的说明，但只有相同的column合并在一起，其他的会被抛弃。

#纵向"内"合并df1与df2

>>> res = pd.concat([df1, df2], axis=0, join='inner')

>>> print(res)

     b    c    d

1  0.0  0.0  0.0

2  0.0  0.0  0.0

3  0.0  0.0  0.0

2  1.0  1.0  1.0

3  1.0  1.0  1.0

4  1.0  1.0  1.0

#重置index并打印结果

>>> res = pd.concat([df1, df2], axis=0, join='inner', ignore_index=True)

>>> print(res)

     b    c    d

0  0.0  0.0  0.0

1  0.0  0.0  0.0

2  0.0  0.0  0.0

3  1.0  1.0  1.0

4  1.0  1.0  1.0

5  1.0  1.0  1.0

4、join_axes(依照axes合并)

>>> import pandas as pd

>>> import numpy as np

>>> df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'], index=[1,2,3])

>>> df2 = pd.DataFrame(np.ones((3,4))*1, columns=['b','c','d','e'], index=[2,3,4])

#依照`df1.index`进行横向合并

>>> res = pd.concat([df1, df2], axis=1, join_axes=[df1.index])

>>> print(res)

     a    b    c    d    b    c    d    e

1  0.0  0.0  0.0  0.0  NaN  NaN  NaN  NaN

2  0.0  0.0  0.0  0.0  1.0  1.0  1.0  1.0

3  0.0  0.0  0.0  0.0  1.0  1.0  1.0  1.0

#移除join_axes，并打印结果

>>> res = pd.concat([df1, df2], axis=1)

>>> print(res)

     a    b    c    d    b    c    d    e

1  0.0  0.0  0.0  0.0  NaN  NaN  NaN  NaN

2  0.0  0.0  0.0  0.0  1.0  1.0  1.0  1.0

3  0.0  0.0  0.0  0.0  1.0  1.0  1.0  1.0

4  NaN  NaN  NaN  NaN  1.0  1.0  1.0  1.0

5、append(添加数据)

append只有纵向合并，没有横向合并。

>>> import pandas as pd

>>> import numpy as np 

>>> df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])

>>> df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

>>> df3 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

>>> s1 = pd.Series([1,2,3,4], index=['a','b','c','d'])

#将df2合并到df1的下面，以及重置index，并打印出结果

>>> res = df1.append(df2, ignore_index=True)

>>> print(res)

     a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

3  1.0  1.0  1.0  1.0

4  1.0  1.0  1.0  1.0

5  1.0  1.0  1.0  1.0

#合并多个df，将df2与df3合并至df1的下面，以及重置index，并打印出结果

>>> res = df1.append([df2, df3], ignore_index=True)

>>> print(res)

     a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

3  1.0  1.0  1.0  1.0

4  1.0  1.0  1.0  1.0

5  1.0  1.0  1.0  1.0

6  1.0  1.0  1.0  1.0

7  1.0  1.0  1.0  1.0

8  1.0  1.0  1.0  1.0

#合并series，将s1合并至df1，以及重置index，并打印出结果

>>> res = df1.append(s1, ignore_index=True)

>>> print(res)

     a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

3  1.0  2.0  3.0  4.0

Pandas 合并 concat的更多相关文章

【转】Pandas学习笔记（五）合并 concat
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
pandas的concat函数和append方法
pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,keys=None, levels=None, nam ...
python pandas合并多个excel(xls和xlsx)文件（弹窗选择文件夹和保存文件）
# python pandas合并多个excel(xls和xlsx)文件(弹窗选择文件夹和保存文件) import tkinter as tk from tkinter import filedial ...
python pandas 合并数据函数merge join concat combine_first 区分
pandas对象中的数据可以通过一些内置的方法进行合并:pandas.merge,pandas.concat,实例方法join,combine_first,它们的使用对象和效果都是不同的,下面进行区分 ...
Pandas合并数据集之concat、combine_first方法
轴向连接(concat) Numpy import numpy as np import pandas as pd from pandas import Series arr = np.arange( ...
pandas合并数据集-【老鱼学pandas】
有两个数据集,我们想把他们的结果根据相同的列名或索引号之类的进行合并,有点类似SQL中的从两个表中选择出不同的记录并进行合并返回. 合并首先准备数据: import pandas as pd imp ...
Pandas合并数据集之merge、join方法
合并数据集 pandas.merge 可根据一个或多个键将不同DataFrame中的行连接起来. pandas.concat 可以沿着一条轴将多个对象堆叠到一起. combine_first merg ...
Pandas 合并merge
pandas中的merge和concat类似,但主要是用于两组有key column的数据,统一索引的数据. 通常也被用在Database的处理当中. 1.依据一组key合并 >>> ...
pandas 合并数据
1. pandas 的merge,join 就不说了. 2. 神奇的: concat append 参考: PANDAS 数据合并与重塑(concat篇) 3.

随机推荐

二十一、springcloud(七)服务网关zuul
1.简介 Eureka用于服务的注册于发现,Feign支持服务的调用以及均衡负载,Hystrix处理服务的熔断防止故障扩散,Spring Cloud Config服务集群配置中心,在微服务架构中,后端 ...
python从含有汉字和数字的字符串中提取数字部分
我遇到的问题是:我想要从字符串“1小时12分钟”中(其中两个数字是变化的)截取出1和12. 切片的方法比较简单,但不适合变化的字符串. filter(str.isdigit,"1小时12分钟 ...
【java】类的继承
继承:特殊类拥有一般类的全部属性与行为. 继承好处:1.提高了代码的复用性2.让类与类之前产生了关系,有了这个关系才有多态的特性.继承是类和类之前的关系. 注意事项: 1.java只支持单继承,不支持 ...
No input file specified.
no input file specified 解决方法 2018年02月23日 14:25:07 tiramisuer8023 阅读数:36607 版权声明:本文为博主原创文章,未经博主允许不得 ...
小程序https请求，http网站升到https
最近开发小程序,因为以前只写过小程序的前端没注意接口,现在才发现原来所有的接口都必须使用https协议了,马上研究了一波,顺便也想给自己的博客升成https的. 申请免费证书哈哈没办法就是喜欢免费的 ...
【spring】之xml和Annotation，Bean注入的方式
基于xml形式Bean注入 @Data @AllArgsConstructor @NoArgsConstructor public class PersonBean { private Integer ...
centos7-软件安装-jdk1.8
JDK1.8下载地址: http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 安装目录 ...
json 中关于json数组跟json对象的区别
原文地址:http://blog.csdn.net/lafengwnagzi/article/details/52789171 JSON 是存储和交换文本信息的语法 JSON 文本格式在语法上与创建 ...
八（第二篇）、主体结构元素——nav元素、aside元素
nav元素 nav元素是一个可以用作页面导航的链接组,其中的导航元素链接到其他页面或当前页面的其他部分. 并不是所有的链接组都要被放进nav元素,只需要将主要的.基本的链接组放进nav元素即可. na ...
用Jedis调用Lua脚本来完成redis的数据操作
1.先完成一个简单的set/get操作 package com.example.HnadleTaskQueue; import redis.clients.jedis.Jedis; import ja ...

Pandas 合并 concat

Pandas 合并 concat的更多相关文章

随机推荐

热门专题