pandas 初识（五）

1. 如何实现把一个属性（列）拆分成多列，产生pivot，形成向量信息，计算相关性？

例：

     class_    timestamp    count

0    10    2019-01-20 13:23:00    1

1    10    2019-01-20 13:24:00    2

2    10    2019-01-20 13:25:00    2

3    10    2019-01-20 13:26:00    1

4    10    2019-01-20 13:27:00    2

转为：

class_ 1 2 3 4 10
timestamp
2019-01-20 13:23:01 1.0 NaN NaN NaN NaN
2019-01-20 13:24:02 NaN NaN 2.0 NaN NaN
2019-01-20 13:25:03 NaN 2.0 NaN NaN NaN
2019-01-20 13:26:02 NaN NaN NaN 1.0 NaN
2019-01-20 13:27:05 NaN NaN NaN NaN 2.0

解决：

import pandas as pd

from pandas import Timestamp

info = {'class_': {0: 1, 1: 2, 2: 3, 3: 4, 4: 10},

 'timestamp': {0: Timestamp('2019-01-20 13:23:00'),

  1: Timestamp('2019-01-20 13:24:00'),

  2: Timestamp('2019-01-20 13:25:00'),

  3: Timestamp('2019-01-20 13:26:00'),

  4: Timestamp('2019-01-20 13:27:00')},

 'count': {0: 1, 1: 2, 2: 2, 3: 1, 4: 2}}

df = pd.DataFrame(info)

# df.pivot(index='timestamp', columns="class_", values="count").fillna(0)

df.pivot(index='timestamp', columns="class_", values="count")

2. 如何实现把一个属性的多列（属性唯一）合并成一列

例：

转为：

     class_    timestamp    count

0    10    2019-01-20 13:23:00    1

1    10    2019-01-20 13:24:00    2

2    10    2019-01-20 13:25:00    2

3    10    2019-01-20 13:26:00    1

4    10    2019-01-20 13:27:00    2

解决：

import pandas as pd

from pandas import Timestampinfo = {'class_': {0: 1, 1: 2, 2: 3, 3: 4, 4: 10},

 'timestamp': {0: Timestamp('2019-01-20 13:23:00'),

  1: Timestamp('2019-01-20 13:24:00'),

  2: Timestamp('2019-01-20 13:25:00'),

  3: Timestamp('2019-01-20 13:26:00'),

  4: Timestamp('2019-01-20 13:27:00')},

 'count': {0: 1, 1: 2, 2: 2, 3: 1, 4: 2}}

df = pd.DataFrame(info)

# df1 = _df.pivot(index='timestamp', columns="class_", values="count").dropna()

df1 = _df.pivot(index='timestamp', columns="class_", values="count")

df1 = _df.stack().reset_index()

df1.columns = ["class_", "count"]

pandas 初识（五）的更多相关文章

pandas初识
pandas初识 1.生成DataFrame型的数据 import pandas as pd import numpy as np dates = pd.date_range('20130101',p ...
pandas 初识（四）
Pandas 和 sqlalchemy 配合实现分页查询 Mysql 并获取总条数 @api.route('/show', methods=["POST"]) def api_sh ...
pandas 初识（三）
Python Pandas 空值 pandas 判断指定列是否(全部)为NaN(空值) import pandas as pd import numpy as np df = pd.DataFrame ...
pandas 初识（一）
基本内容 Series: Series 是有一组数据(numpy的数据类型 numpy.ndarray)以及一组数据标签(即索引)组成,可以看成一个一个定长的有序字典(索引值到数据值的一个映射) ob ...
pandas 初识（二）
基本统计 pivot_table(数据透视表 ): 使用appfunc, 按不同index分类统计各特征values的值 df.pivot_table(index="Pclass" ...
pandas（五）处理缺失数据和层次化索引
pandas用浮点值Nan表示浮点和非浮点数组中的缺失数据.它只是一个便于被检测的标记而已. >>> string_data = Series(['aardvark','artich ...
pandas求五日线并画图
import pandas as pd import numpy as np import matplotlib.pyplot as plt stock_data = pd.read_csv('000 ...
pandas 初识(六）-可视化
Pandas 在一张图中绘制多条线 import pandas as pd import numpy as npimport matplotlib.pyplot as plt df = pd.Data ...
利用Python进行数据分析-Pandas(第五部分-数据规整：聚合、合并和重塑)
在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析.本部分关注可以聚合.合并.重塑数据的方法. 1.层次化索引层次化索引(hierarchical indexing)是panda ...

随机推荐

ruby2.2 DevKit 安装后无法使用解决方案
windows 系统下,Ruby 的某些 gem 包需要 DevKit 才能正常安装,2.4 以后的版本可以一键安装 DevKit,之前的版本只能手动安装. 2.4 以后的可以到官网下载:https: ...
webpack4.0各个击破（6）—— Loader篇【华为云技术分享】
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...
Redux和Context对比
Redux和Context对比如果项目体量较小,只是需要一个公共的store存储state,而不讲究使用action来管理state,那context完全可以胜任.反之,则是redux的优点. co ...
CF1009F Dominant Indices（启发式合并）
You are given a rooted undirected tree consisting of nn vertices. Vertex 11 is the root. Let's denot ...
Docker系列-(2) 镜像制作与发布
上篇文章引入了Docker的基本原理和操作,本节文章主要介绍如何制作Docker镜像和发布. 镜像文件结构 Docker镜像的本质是一系列文件的集合,这些文件依次叠加,形成了最后的镜像文件,类似于下图 ...
C语言之推箱子游戏代码
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:Yan_Less 正文新手注意:如果你学习遇到问题找不到人解答,可以点 ...
笔记||Python3之异常处理
异常概念:1 - 代码执行产生错误,无法继续 2 - 在异常前面代码是可以执行的 ---python是解释型的 3 - 异常作用 --- 程序不要退出 - 可以继续执行同时给予程序员一定的异常提 ...
Django 08
目录 sweetalert弹窗 bulk-create 自定义分页器 sweetalert弹窗下载sweetalert并存放在Django项目中的静态文件夹中 https://github.com/ ...
选择排序 C&&C++
选择排序选择排序即在每一步中选取最小值重新排列,从而达到排序的目的流程: (1)先从原始数组选择一个最小数据和第一个位置交换 (2)剩下的n-1个数据选择最小的和第二个位置交换 (3)不断重复 ...
201871010119-帖佼佼《面向对象程序设计（java）》第十一周学习总结
博文正文开头格式:(2分) 项目内容这个作业属于哪个课程 https://www.cnblogs.com/nwnu-daizh/ 这个作业的要求在哪里 https://www.cnblogs.co ...

pandas 初识（五）

1. 如何实现把一个属性（列）拆分成多列，产生pivot，形成向量信息，计算相关性？

2. 如何实现把一个属性的多列（属性唯一）合并成一列

pandas 初识（五）的更多相关文章

随机推荐

热门专题