一、缘由

　　在爬取大量的数据之后，需要对数据进行分组的处理，于是就使用了groupby，但是我需要的并不是分组之后数据的聚合分析，我需要的是原生的某些数据。但是却找不到网上的相关案例。于是，我就自己尝试的进行。终于找到了去找原生数据的方法了。

二、具体实现

　　1、先看一个简单和基础的

for i in pd[pd['备注'] == 1].groupby(['model_id']):

    print(i)

    break

#结果是一个有分组名称和分组数据形成的数组

　　2、再看一个清晰一些的

for groupname,group_df in pd[pd['备注'] == 1].groupby(['model_id']):

    print(groupname,group_df)

    break

#结果是一个有分组名称和分组数据

　　3、然后实现寻找分组中的某个数据，并使用字典进行保存

for groupname,group_df in pd[pd['备注'] == 1].groupby(['model_id'])：

    pf_id_list = []

    ps_id_list = []

    item = {}

    for i in group_df['pf_id']:

        print(i)

        pf_id_list.append(str(int(i)))

    for j in group_df['ps_id']:

        ps_id_list.append(str(int(j)))

    for m in range(len(pf_id_list)):

        item[pf_id_list[m]] = ps_id_list[m]

    print(pf_id_list,ps_id_list)

    print(group_df)

    print(item)

    break

　　　　ok,到此结束，实现需求。

pandas中groupby的使用的更多相关文章

pandas中groupby的参数：as_index
参考:https://blog.csdn.net/cjsyr6wt/article/details/78200444?locationNum=11&fps=1 以下是pandas官方的解释: ...
数据分析面试题之Pandas中的groupby
昨天晚上,笔者有幸参加了一场面试,有一个环节就是现场编程!题目如下: 示例数据如下,求每名学生(ID)对应的成绩(score)最高的那门科目(class)与ID,用Python实现: 这个题目 ...
python处理数据的风骚操作[pandas 之 groupby&agg]
https://segmentfault.com/a/1190000012394176 介绍每隔一段时间我都会去学习.回顾一下python中的新函数.新操作.这对于你后面的工作是有一定好处的.本文重 ...
（数据科学学习手札69）详解pandas中的map、apply、applymap、groupby、agg
*从本篇开始所有文章的数据和代码都已上传至我的github仓库:https://github.com/CNFeffery/DataScienceStudyNotes 一.简介 pandas提供了很多方 ...
pandas中的分组技术
目录 1 分组操作 1.1 按照列进行分组 1.2 按照字典进行分组 1.3 根据函数进行分组 1.4 按照list组合 1.5 按照索引级别进行分组 2 分组运算 2.1 agg 2 ...
pandas获取groupby分组里最大值所在的行,获取第一个等操作
pandas获取groupby分组里最大值所在的行 10/May 2016 python pandas pandas获取groupby分组里最大值所在的行如下面这个DataFrame,按照Mt分组, ...
Spark与Pandas中DataFrame对比
Pandas Spark 工作方式单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈分布式并行计算框架,内建并行机制paral ...
Spark与Pandas中DataFrame对比（详细）
Pandas Spark 工作方式单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈分布式并行计算框架,内建并行机制paral ...
pandas之groupby分组与pivot_table透视表
zhuanzi: https://blog.csdn.net/qq_33689414/article/details/78973267 pandas之groupby分组与pivot_table透视表 ...

随机推荐

filebeat知识点
在Filebeat的根目录下,有一个叫做filebeat.yml的文件. filebeat.inputs: - type: log enabled: true paths: - ./sample.lo ...
Typora如何配置gitee图床
转载自:https://mp.weixin.qq.com/s/5dPLbr2vFgL18XKL1Y05Og 要求: 1.Typora需要升级到最新版 2.需要安装nodejs PicGo软件下载地址: ...
Ingress
一.需求背景固定对外提供服务采用了NodePort方式映射并固定了30001端口,但是,该端口默认范围是30000~32767,并且我们的web服务一般都是80.443端口对外,因此我们产生了如下几 ...
Beats & FileBeat
Beats是一个开放源代码的数据发送器.我们可以把Beats作为一种代理安装在我们的服务器上,这样就可以比较方便地将数据发送到Elasticsearch或者Logstash中.Elastic Stac ...
Python实现改进后的Bi-RRT算法实例
Python实现改进后的Bi-RRT算法实例 1.背景说明以下代码是参照上海交通大学海洋工程国家重点实验室<基于改进双向RRT的无人艇局部路径规划算法研究>的算法思想实现的. 2.算法流 ...
PHP全栈开发（八）：CSS Ⅴ 超链接 style
CSS里面有专门针对超链接的选择器,也就是他们: a:link - 正常,未访问过的链接 a:visited - 用户已访问过的链接 a:hover - 当用户鼠标放在链接上时 a:active - ...
洛谷P2602 [ZJOI2010] 数字计数（数位DP）
白嫖的一道省选题...... 1 #include<cstdio> 2 #include<cstring> 3 #include<algorithm> 4 usin ...
MyBatisPlus分页插件在SpringBoot中的使用
文章目录 1.目录结构 2.新增配置 3.编写测试类 4.测试结果 5.数据库中的表文件的创建: https://blog.csdn.net/weixin_43304253/article/deta ...
jstl的使用转发和重定向（做项目遇到的一些问题总结）
文章目录 1.jstl的使用 2.转发和重定向 3.shiro 4.spring是什么? 5.对AOP的理解 6.标签通常和标签一起使用 7.springmvc中的form表单 7.1 form标签 ...
使用dotnet-monitor sidecar模式 dump docker运行的dotnet程序.
前情概要随着容器和云技术的发展, 大量的应用运行在云上的容器中, 它们的好处是毋庸置疑的, 例如极大的提高了我们的研发部署速度, 快速的扩缩容等等, 但是也存在一些小小的问题, 例如难以调试. 基于 ...

pandas中groupby的使用

一、缘由

二、具体实现

pandas中groupby的使用的更多相关文章

随机推荐

热门专题