pandas的apply操作

pandas的apply操作类似于Scala的udf一样方便，假设存在如下dataframe：

  id_part                  pred               pred_class v_id

0       d  [0.722817, 0.650064]                  cat,dog   d1

1       5  [0.119208, 0.215449]  other_label,other_label   d2

需要把 v_id=d1 中，pred 与 pred_class 一一对应，需要将 pred 大于0.5的pred_class取出来作为新的一列，如果小于0.5则不取出来：

import pandas as pd

# 提取类别

def get_pred_class(pred_class, pred):

    pred_class_list = pred_class.split(",")

    result_class_list = []

    for i in range(0, len(pred)):

        if float(pred[i]) >= 0.5:

            result_class_list.append(pred_class_list[pred.index(pred[i])])

    return result_class_list

# 新建一个dataframe

data = pd.DataFrame({

    'v_id': ["d1", 'd2'],

    'pred_class': ["cat,dog", 'other_label,other_label'],

    'pred': [[0.722817,0.650064], [0.119208,0.215449]],

    'id_part': ["d", '5'],

})

df = data.copy()

df["pos_labels"] = data.apply(lambda row: get_pred_class(row['pred_class'], row['pred']), axis=1)

print(df)

得到结果为：

  id_part                  pred               pred_class v_id  pos_labels

0       d  [0.722817, 0.650064]                  cat,dog   d1  [cat, dog]

1       5  [0.119208, 0.215449]  other_label,other_label   d2          []

PS：如果没有df = data.copy()将会出现错误：

A value is trying to be set on a copy of a slice from a DataFrame.

Try using .loc[row_indexer,col_indexer] = value instead

pandas的apply操作的更多相关文章

python数据结构：pandas(2)数据操作
一.Pandas的数据操作 0.DataFrame的数据结构 1.Series索引操作 (0)Series class Series(base.IndexOpsMixin, generic.NDFra ...
数据分析05 /pandas的高级操作
数据分析05 /pandas的高级操作目录数据分析05 /pandas的高级操作 1. 替换操作 2. 映射操作 3. 运算工具 4. 映射索引 / 更改之前索引 5. 排序实现的随机抽样/打乱表 ...
pandas DataFrame apply()函数(2)
上一篇pandas DataFrame apply()函数(1)说了如何通过apply函数对DataFrame进行转换,得到一个新的DataFrame. 这篇介绍DataFrame apply()函数 ...
Pandas的基础操作（一）——矩阵表的创建及其属性
Pandas的基础操作(一)——矩阵表的创建及其属性 (注:记得在文件开头导入import numpy as np以及import pandas as pd) import pandas as pd ...
Pandas的拼接操作
pandas的拼接操作 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join import pandas as pd import n ...
（四）pandas的拼接操作
pandas的拼接操作 #重点 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join 0. 回顾numpy的级联 import num ...
pandas 写csv 操作
pandas 写csv 操作 def show_history(self): df = pd.DataFrame() df['Time'] = pd.Series(self.time_hist) df ...
pandas的聚合操作: groupyby与agg
pandas提供基于行和列的聚合操作,groupby可理解为是基于行的,agg则是基于列的从实现上看,groupby返回的是一个DataFrameGroupBy结构,这个结构必须调用聚合函数(如su ...
pandas：apply和transform方法的性能比较
1. apply与transform 首先讲一下apply() 与transform()的相同点与不同点相同点: 都能针对dataframe完成特征的计算,并且常常与groupby()方法一起使用. ...

随机推荐

Python3 requests与http.cookiejar的使用（cookie的保存与加载）
在学习Python之余,发现Python2与Python3 有很大的变化,之前使用urllib和cookielib来保存cookie,发现很繁琐,于是改用requests.发现cookielib在3. ...
maintenance.go
package, && req.Alarm == pb.AlarmType_NONE { ar, err := m.AlarmList(ctx) if ...
【BZOJ 2004】: [Hnoi2010]Bus 公交线路
题目链接: TP 题解: 所以说,超显眼的数据范围啊. 很显然我们对于每个P的区间都是要有k个站被bus停留,然后考虑转移的话应该是把这k个站里的某个bus往前走,那么转移也很显然了,n的范围很大 ...
BZOJ_1654_[Usaco2007 Open]City Horizon 城市地平线_扫描线
BZOJ_1654_[Usaco2007 Open]City Horizon 城市地平线_扫描线 Description N个矩形块,交求面积并. Input * Line 1: A single i ...
BZOJ_1828_[Usaco2010 Mar]balloc 农场分配_线段树
BZOJ_1828_[Usaco2010 Mar]balloc 农场分配_线段树 Description Input 第1行:两个用空格隔开的整数:N和M * 第2行到N+1行:第i+1行表示一个整数 ...
为什么说JAVA中要慎重使用继承
JAVA中使用到继承就会有两个无法回避的缺点: 打破了封装性,迫使开发者去了解超类的实现细节,子类和超类耦合. 超类更新后可能会导致错误. 继承打破了封装性关于这一点,下面是一个详细的例子(来源于E ...
jquery 判断一个元素是否在数组中 $.inarry()使用
需要判断一个元素是否在一个数组里: js indexOf()方法如果存在则返回该元素的下标值如果不存在则返回-1 学习源头: http://www.w3school.com.cn/jsref/ ...
java JDK配置环境变量
1)将下载的jdk放置到一定文件夹中,注意文件夹名不能有中文! 2)设置环境变量 a.可以在系统变量中找到path这个变量,然后将jdk下的bin的根目录添加进去注意:一定要放在path变量值的最前 ...
selenium IDE 使用方法整理
1.设置起始点(确定case从哪步开始执行),快捷键:S,效果图如下: 2.设置断点(case执行到添加断点处,将自动停止),快捷键:B,效果图如下: 3.设置判断点如:百度输入ceshi,点 ...
安卓开发笔记（二十六）：Splash实现首页快速开屏功能
我们在进行安卓开发的时候,首页开有两种方式,一种是利用handler将一个活动进行延时,时间到达之后软件则会跳转到第二个活动当中.而另一种方法则是更加常用的方法,利用splash实现首页的快速开屏,这 ...

pandas的apply操作

pandas的apply操作的更多相关文章

随机推荐

热门专题