pandas-14 concatenate和combine_first的用法

concatenate主要作用是拼接series和dataframe的数据。

combine_first可以做来填充数据。

其中numpy和panads中都有concatenate()方法，如：np.concatenate([arr1, arr2])、pd.concat([s1, s2])

Series类型可以使用 s2 中的数值来填充 s1，如：s1.combine_first(s2)

Dataframe类型同样可以使用 df2 中的数组来填充 df1，如：df1.combine_first(df2)

import numpy as np

import pandas as pd

from pandas import Series, DataFrame

# 设置一个随机种子，方便调试

np.random.seed(666)

# Series

arr1 = np.arange(9).reshape(3, 3)

arr2 = np.arange(9).reshape(3, 3)

# numpy的 concatenate 用法

print(np.concatenate([arr1, arr2]))

'''

[[0 1 2]

 [3 4 5]

 [6 7 8]

 [0 1 2]

 [3 4 5]

 [6 7 8]]

'''

print(np.concatenate([arr1, arr2], axis=1))

'''

[[0 1 2 0 1 2]

 [3 4 5 3 4 5]

 [6 7 8 6 7 8]]

'''

s1 = Series([1, 2, 3], index=['A', 'B', 'C'])

s2 = Series([4, 5], index=['E', 'F'])

# 可以看出和numpy的效果一样

print(pd.concat([s1, s2]))

'''

A    1

B    2

C    3

E    4

F    5

dtype: int64

'''

# 用法和 np 一样 axis = 1, 等于增加了一列

print(pd.concat([s1, s2], axis=1))

# 但是，返回的是一个 <class 'pandas.core.frame.DataFrame'>

print(type(pd.concat([s1, s2], axis=1)))

'''

     0    1

A  1.0  NaN

B  2.0  NaN

C  3.0  NaN

E  NaN  4.0

F  NaN  5.0

'''

df1 = DataFrame(np.random.randn(4, 3), columns=['X', 'Y', 'Z'])

print(df1)

'''

          X         Y         Z

0  0.824188  0.479966  1.173468

1  0.909048 -0.571721 -0.109497

2  0.019028 -0.943761  0.640573

3 -0.786443  0.608870 -0.931012

'''

df2 = DataFrame(np.random.randn(3, 3), columns=['X', 'Y', 'A'])

print(df2)

'''

          X         Y         A

0  0.978222 -0.736918 -0.298733

1 -0.460587 -1.088793 -0.575771

2 -1.682901  0.229185 -1.756625

'''

print(pd.concat([df1, df2]))

'''

          A         X         Y         Z

0       NaN  0.824188  0.479966  1.173468

1       NaN  0.909048 -0.571721 -0.109497

2       NaN  0.019028 -0.943761  0.640573

3       NaN -0.786443  0.608870 -0.931012

0 -0.298733  0.978222 -0.736918       NaN

1 -0.575771 -0.460587 -1.088793       NaN

2 -1.756625 -1.682901  0.229185       NaN

'''

# combine

s1 = Series([2, np.nan, 4, np.nan], index=['A', 'B', 'C', 'D'])

s2 = Series([1, 2, 3, 4], index=['A', 'B', 'C', 'D'])

# 用 s2 中的数值来填充 s1

print(s1.combine_first(s2))

'''

A    2.0

B    2.0

C    4.0

D    4.0

dtype: float64

'''

df1 = DataFrame({

    'X':[1, np.nan, 3, np.nan],

    'Y':[5, np.nan, 7, np.nan],

    'Z':[9, np.nan, 11, np.nan]

})

df2 = DataFrame({

    'Z':[np.nan, 10, np.nan, 12],

    'A':[1, 2, 3, 4]

})

# 功能同样是填充

print(df1.combine_first(df2))

'''

     A    X    Y     Z

0  1.0  1.0  5.0   9.0

1  2.0  NaN  NaN  10.0

2  3.0  3.0  7.0  11.0

3  4.0  NaN  NaN  12.0

'''

pandas-14 concatenate和combine_first的用法的更多相关文章

9.14.16 Django ORM进阶用法
2018-9-14 14:26:45 ORM 练习题 : http://www.cnblogs.com/liwenzhou/articles/8337352.html 2018-9-14 21:1 ...
Pandas | 14 统计函数
统计方法有助于理解和分析数据的行为.可以将这些统计函数应用到Pandas的对象上. pct_change()函数系列,DatFrames和Panel都有pct_change()函数.此函数将每个元素 ...
[Python] Pandas 中 Series 和 DataFrame 的用法笔记
目录 1. Series对象自定义元素的行标签使用Series对象定义基于字典创建数据结构 2. DataFrame对象自定义行标签和列标签使用DataFrame对象可以基于字典创建数据结构 ...
ASP.NET Core 6框架揭秘实例演示[14]：日志的进阶用法
为了对各种日志框架进行整合,微软创建了一个用来提供统一的日志编程模式的日志框架.<日志的基本编程模式>以实例演示的方式介绍了日志的基本编程模式,现在我们来补充几种"进阶" ...
14. js字符串截取substring用法
columnIds = columnIds.substring(0, columnIds.length-1);
pandas.drop/isnull/fillna/astype的用法
删除表中的某一行或者某一列更明智的方法是使用drop,它不改变原有的df中的数据,而是返回另一个dataframe来存放删除后的数据. (1)清理无效数据 df[df.isnull()] #返回的是个 ...
14.Python bytes类型及用法
Python 3 新增了 bytes 类型,用于代表字节串(这是本教程创造的一个词,用来和字符串对应).字符串(str)由多个字符组成,以字符为单位进行操作:字节串(bytes)由多个字节组成,以字节 ...
Pandas：loc iloc ix用法
参考:Pandas中关于 loc \ iloc \ ix 用法的理解相同点使用形式都是 df.xxx[ para1 , para2 ] #xxx表示loc iloc ix#df表示一个DataFr ...
Pandas常用功能总结
1.读取.csv文件 df2 = pd.read_csv('beijingsale.csv', encoding='gb2312',index_col='id',sep='\t',header=Non ...

随机推荐

咏南跨平台中间件REST API
主旨 1)为了中间件支持跨操作系统部署,客户端支持跨操作系统.跨设备.跨开发语言,特制订本REST API规约. 2)所有接口均支持HTTP GET\POST调用. 3)调用示例为DELPHI代码,其 ...
对IT战略的认识
提到战略,我不由想起了战术这个名词.按照我的理解,战术属于短期内的计划,是战略的组成部分,是实施次战略的短期工作计划或行动步骤:而战略是用来帮助我们赢取目标的行动计划(例如为获得更多的潜在客户而制定的 ...
mybatis ResultHandler vs ResultSetHandler及自定义扩展
ResultSetHandler是mybatis的关键类之一,用于对jdbc返回的ResultSet进行映射处理,其中包括列前缀处理,逻辑分页,鉴别器(Discriminator,基于值实现动态映射列 ...
NLP基本模型
textcnn: 加载预训练词典:https://blog.csdn.net/nlpuser/article/details/83627709 构建textcnn网络:https://blog.csd ...
我最近买的书里面带的CD盘，放电脑里后，说是0字节，但是可以播放，不能把里面的东西复制出来
我最近买的书里面带的CD盘,放电脑里后,说是0字节,但是可以播放,不能把里面的东西复制出来,有track1,track2之类的文件,都只有几十字节大,请问有没有什么方法把里面的音乐复制出来??? 用w ...
matlab学习笔记12_2创建结构体数组,访问标量结构体,访问非标量结构体数组的属性,访问嵌套结构体中的数据，访问非标量结构体数组中多个元素的字段
一起来学matlab-matlab学习笔记12 12_2 结构体创建结构体数组,访问标量结构体,访问非标量结构体数组的属性,访问嵌套结构体中的数据,访问非标量结构体数组中多个元素的字段觉得有用的话 ...
人脸识别（基于ArcFace）
我们先来看看效果上面是根据图片检测出其中的人脸.每个人脸的年龄还有性别,非常强大第一步: 登录https://ai.arcsoft.com.cn/,注册开发者账号,身份认证,注册应用,得到APPI ...
ABAP基础篇1 内表
内表类型 abap 内表类型有三种: 标准表(一般ABAP程序中用的最多就是这种表) 系统为该表的每一行数据生成一个逻辑索引,自己内部维护着行号(Index)的编码.表的键值不唯一,且没有按照表键自动 ...
c# HTML5 Blob对象实现媒体播放功能
后台代码: public ActionResult Video() { string filePath = @"D:\download\test.mp ...
一步一步FLASK（一）
简介: 本文是记录本人建立一个flask项目的完整过程. 涉及FLASK的诸多实用技术. 一:基本FLASK pycharm建立FLASK项目即可运行. 代码如下: from flask import ...

pandas-14 concatenate和combine_first的用法

pandas-14 concatenate和combine_first的用法

pandas-14 concatenate和combine_first的用法的更多相关文章

随机推荐

热门专题