DataFrame数据合并

一、join

作用：默认情况下，他是把行索引相同的数据合并到一起
注意：以左为准，没有的部分用NaN补全

例子

import pandas as pd

import numpy as np

df1 = pd.DataFrame(data=np.zeros((2, 5)), index=list('AB'), columns=list('VWXYZ'))

# print(df1)

df2 = pd.DataFrame(data=np.ones((3, 4)), index=list('ABC'), columns=list(''))

# print(df2)

df3 = df1.join(df2)

print(df3)

df4 = df2.join(df1)

print(df4)

二、merge

作用：按照指定列把数据按照一定的方式合并到一起

语法

df1.merge(df2, left_on='', right_on='', how='')

left_on: df1的列索引

right_on: df2的列索引

how: 合并方式

    inner 交集

    outer 并集，NaN补全

    left 以左为准,NaN补全

    right 以右为准,NaN补全

例子

import pandas as pd

import numpy as np

df1 = pd.DataFrame(data=np.ones((3, 4)), index=list('ABC'), columns=list('MNOP'))

df1['O'] = ['a', 'b', 'c']

print(df1)

df2 = pd.DataFrame(data=np.zeros((2, 5)), index=list('AB'), columns=list('VWXYZ'))

df2['X'] = ['c', 'd']

print(df2)

df3 = df1.merge(df2, left_on='O', right_on='X', how='right')

print(df3)

DataFrame数据合并的更多相关文章

Pandas中DataFrame数据合并、连接（concat、merge、join）之merge
二.merge:通过键拼接列类似于关系型数据库的连接方式,可以根据一个或多个键将不同的DatFrame连接起来. 该函数的典型应用场景是,针对同一个主键存在两张不同字段的表,根据主键整合到一张表里面 ...
Pandas中DataFrame数据合并、连接（concat、merge、join）之join
pandas.DataFrame.join 自己弄了很久,一看官网.感觉自己宛如智障.不要脸了,直接抄 DataFrame.join(other, on=None, how='left', lsuff ...
Pandas中DataFrame数据合并、连接（concat、merge、join）之concat
一.concat:沿着一条轴,将多个对象堆叠到一起 concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, key ...
pandas中，dataframe 进行数据合并-pd.concat()
``# 通过数据框列向(左右)合并 a = pd.DataFrame(X_train) b = pd.DataFrame(y_train) # 合并数据框(合并前需要将数据设置成DataFrame格式 ...
python 数据清洗之数据合并、转换、过滤、排序
前面我们用pandas做了一些基本的操作,接下来进一步了解数据的操作, 数据清洗一直是数据分析中极为重要的一个环节. 数据合并在pandas中可以通过merge对数据进行合并操作. import n ...
pandas学习(数据分组与分组运算、离散化处理、数据合并)
pandas学习(数据分组与分组运算.离散化处理.数据合并) 目录数据分组与分组运算离散化处理数据合并数据分组与分组运算 GroupBy技术:实现数据的分组,和分组运算,作用类似于数据透视表 ...
python 数据合并
1. 数据合并前言一.横向合并 1. 基本合并语句 2. 键值名不一样的合并 3. “两个数据列名字重复了”的合并二.纵向堆叠统计师的Python日记[第6天:数据合并] 前言根据我的Pyt ...
PANDAS 数据合并与重塑（join/merge篇）
pandas中也常常用到的join 和merge方法 merge pandas的merge方法提供了一种类似于SQL的内存链接操作,官网文档提到它的性能会比其他开源语言的数据操作(例如R)要高效. 和 ...
9-Pandas之数据合并与轴向连接（pd.concat()的详解）
数据合并:由于数据可能是不同的格式,且来自不同的数据源,为了方便之后的处理与加工,需要将不同的数据转换成一个DataFrame. Numpy中的concatenate().vstack().hstac ...

随机推荐

2018.11.2浪在ACM集训队第三次测试赛
2018.11.2 浪在ACM 集训队第三次测试赛整理人:孔晓霞 A 珠心算测试参考博客:[1]李继朋 B 比例简化参考博客: [1]李继朋 C 螺旋矩阵参考博客:[1]朱远迪 D 子矩阵 ...
慕课网electron写音乐播放器教程，代码跟随教程变动（十）
添加播放状态,首先是歌曲名称和时间在index.html中添加 <div class="container fixed-bottom bg-white pb-4"> ...
运用NodeJs环境并依赖第三方库，框架等实现网站前后端分离报错问题及处理方法
运用NodeJs环境并依赖第三方库,框架等实现网站前后端分离报错问题及处理方法问题一: SyntaxError: missing ) after argument list in .....\vie ...
【Git】git-filter-branch - Rewrite branches
1.命令使用场景 ①Removing sensitive data from a repository(https://help.github.com/en/github/authenticating ...
Python15_包的安装和管理
pip的安装及简单使用:https://www.cnblogs.com/csucat/p/4897695.html 使用pip手动安装第三方库:https://blog.csdn.net/github ...
kali添加路由
kali添加路由 vim /etc/network/interfaces iface eth0 inet static address 192.168.1.10 netmask 255.255.255 ...
仿快播APP源码
目录仿快播系统一.项目总结三步走二.项目需求分析三.搭建框架四.ORM框架分析五.功能分析六.项目开发--仿快播视频服务端client start.py ---- 启动文件 conf ...
ELK学习实验008：Kibana的介绍
一简介 Kiana是一款开源的数据分析和可视化平台,它是 Elastic Stack成员之一,设计用于和 Elasticsearch协作.您可以使用 Kiana对 Elasticsearch索引中的 ...
DEVOPS技术实践_20:串联多个job执行
在jenkins可能会有战役中场景,就是在一个job执行完之后,把这个执行结果作为另一个job的执行条件比如A执行完,如果A执行成功,则执行B,如果失败则执行C 1 前期准备 A任务 import ...
node多进程的创建与守护
node是单线程运行,我们的node项目如何利用多核CPU的资源,同时提高node服务的稳定性呢? 1. node的单线程进程是一个具有一定独立功能的程序在一个数据集上的一次动态执行的过程,是操作系 ...

DataFrame数据合并

DataFrame数据合并的更多相关文章

随机推荐

热门专题