pandas DataFrame 的横向纵向拼接组合

concat 与其说是连接，更准确的说是拼接。就是把两个表直接合在一起。于是有一个突出的问题，是横向拼接还是纵向拼接，所以concat 函数的关键参数是axis 。
函数的具体参数是：

concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,levels=None,names=None,verigy_integrity=False)

objs 是需要拼接的对象集合，一般为列表或者字典

axis=0 是按照行拼接，拼接之后行数增加，列数也根据join来定，join=’outer’时，列数是两表并集。同理join=’inner’,列数是两表交集。

在默认情况下为纵向拼接，即axis=0，此时有

concat([df1,df2]) 等价于 df1.append(df2)

在axis=1 时为横向拼接，此时有

concat([df1,df2],axis=1) 等价于 merge(df1,df2,left_index=True,right_index=True,how='outer')

以上转自： https://blog.csdn.net/qq_30718387/article/details/72152461

应用举例：

df=pandas.DataFrame()

df2=pandas.DataFrame()

df['id']=[1,2,3,4]
df['name']=['zhang','chen','lee','wang']

df2['id']=[2,3,4,5]
df2['place']=['Shenzhen','Hongkong','NewYork','London']


df3=pandas.DataFrame({'id':[]})

用法1：把来自两个不同DataFrame的列，纵向拼接到一起，赋值给另一个DataFrame的列。

df3['id']=pandas.concat([df['id'],df2['id']],axis=0,ignore_index=True)

执行后，

df3['id']=[1,2,3,4,5,2,3,4,5]

用法2：两个DataFrame进行纵向拼接：

df4=pandas.concat([df,df2],axis=0,ignore_index=True)

执行后，df4=

index	id	name	place
0	1	zhang	NaN
1	2	chen	NaN
2	3	lee	NaN
3	4	wang	NaN
4	2	NaN	Shenzhen
5	3	NaN	HongKong
6	4	NaN	NewYork
7	5	NaN	London

用法3：两个DataFrame进行横向拼接：

df4=pandas.concat([df,df2],axis=1,ignore_index=True)

执行后，df4=

index	0	1	2	3
0	1	zhang	2	Shenzhen
1	2	chen	3	HongKong
2	3	lee	4	NewYork
3	4	wang	5	London

多个拼接还可以使用生成器：

dfs=[df1,df2,df3,df4,df5]

df6=pandas.DataFrame()

df6['id']=pd.concat([df['id'] for df in dfs])

pandas DataFrame 的横向纵向拼接组合的更多相关文章

pandas.DataFrame学习系列1——定义及属性
定义: DataFrame是二维的.大小可变的.成分混合的.具有标签化坐标轴(行和列)的表数据结构.基于行和列标签进行计算.可以被看作是为序列对象(Series)提供的类似字典的一个容器,是panda ...
如何通过Elasticsearch Scroll快速取出数据，构造pandas dataframe — Python多进程实现
首先,python 多线程不能充分利用多核CPU的计算资源(只能共用一个CPU),所以得用多进程.笔者从3.7亿数据的索引,取200多万的数据,从取数据到构造pandas dataframe总共大概用 ...
打印datagridview内容实现横向纵向分页（转）
网上找了很多打印的,只发现这个比较好,实现了横向纵向分页. 代码如下: using System;using System.Collections.Generic;using System.Text; ...
Oracle横向纵向汇总
Oracle横向纵向汇总有一张表test 如下, (NO 学生编号 ,cj 成绩) NO name KM CJ 001 张三语文 80 001 张三数学 86 001 张三英语 75 0 ...
固定表头，单元格td宽度自适应，多内容出现-横向纵向滚动条数据表格的<前世今生>
固定表头,单元格td宽度自适应,多内容出现-横向纵向滚动条数据表格的<前世今生> 先上图例 & 无论多少数据--都完美! 背景:由于我司行业方向,需要很多数据报表,则t ...
pandas.DataFrame的pivot()和unstack()实现行转列
示例: 有如下表需要进行行转列: 代码如下: # -*- coding:utf-8 -*- import pandas as pd import MySQLdb from warnings impor ...
pandas DataFrame apply()函数(1)
之前已经写过pandas DataFrame applymap()函数还有pandas数组(pandas Series)-(5)apply方法自定义函数 pandas DataFrame 的 app ...
pandas DataFrame apply()函数(2)
上一篇pandas DataFrame apply()函数(1)说了如何通过apply函数对DataFrame进行转换,得到一个新的DataFrame. 这篇介绍DataFrame apply()函数 ...
把pandas dataframe转为list方法
把pandas dataframe转为list方法先用numpy的 array() 转为ndarray类型,再用tolist()函数转为list

随机推荐

undef用法
#undef的语法定义:#undef 标识符,用来将前面定义的宏标识符取消定义. 整理了如下几种#undef的常见用法. 1. 防止宏定义冲突在一个程序块中用完宏定义后,为防止后面标识符冲突需要取消 ...
Linux常用的安全加固
一.账号和口令 1.1 禁用或删除无用账号减少系统无用账号,降低安全风险. 操作步骤userdel <用户名> //删除不必要的账号.passwd -l <用户名> //锁定 ...
用Navicat建MySQL数据库表，动态改变创建时间和更新时间戳
1.create_time 记录创建的时间,设默认值为:CURRENT_TIMESATMP 注意:不勾选那个[根据当前时间戳更新] 2.operator_time 更新记录的时间,勾选那个[根据当前时 ...
POJ3169(差分约束：转载)
转载自mengxiang000000传送门 Layout Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 10278 Ac ...
Spring Cloud Alibaba系列（二）nacos作为服务配置中心
Nacos 提供用于存储配置和其他元数据的 key/value 存储,为分布式系统中的外部化配置提供服务器端和客户端支持.使用 Spring Cloud Alibaba Nacos Config,您可 ...
第九章：Python高级编程-Python socket编程
第九章:Python高级编程-Python socket编程 Python3高级核心技术97讲笔记 9.1 弄懂HTTP.Socket.TCP这几个概念 Socket为我们封装好了协议 9.2 cl ...
Coursera课程笔记----计算导论与C语言基础----Week 11
C程序中的字符串(Week 11) 字符数组所有的字符串,都是以\0结尾的只能在数组定义并初始化的时候:char c[6] = "China"; 不能用赋值语句将一个字符串常量 ...
【华为云技术分享】智能诊断和优化，华为云DAS服务云DBA平台让您无忧运维
摘要:随着时代的发展,传统的“人工”运维方式,已经逐渐跟不上企业业务发展的需要.如何更好的保证数据库系统的稳定性.安全性.完整性和高性能,实现运维工具化.产品化.自助化.自动化,是当前数据管理和运维面 ...
Spring Cloud 系列之 Config 配置中心（三）
本篇文章为系列文章,未读前几集的同学请猛戳这里: Spring Cloud 系列之 Config 配置中心(一) Spring Cloud 系列之 Config 配置中心(二) 本篇文章讲解 Conf ...
A~Z；26个字母美式
26个字母美式读法音频下载地址: 链接:https://pan.baidu.com/s/1KOlxNCydgtsODQZMT9JFJg 提取码:8a9g

pandas DataFrame 的横向纵向拼接组合

pandas DataFrame 的横向纵向拼接组合的更多相关文章

随机推荐

热门专题