pandas可视化:各种图的简单使用
一、Matplotlib中几种图的名字
- 折线图:plot
- 柱形图:bar
- 直方图:hist
- 箱线图:box
- 密度图:kde
- 面积图:area
- 散点图:scatter
- 散点图矩阵:scatter_matrix
- 饼图:pie
二、折线图:plot
平均值需要先排序后出出图
df.avg.value_counts().sort_index().plot()
三、柱形图:bar
可先做数据透视,然后生成柱形图
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.bar()
如果是要做堆叠柱形图,则可设置bar()的参数
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.bar(stacked=True)
如果是要做成条形图,则可修改bar()方法为bar()
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.barh()
四、直方图:hist
df.avg.plot.hist()
以“education”字段多维分析,对平均值绘制直方图,
alpha:图形透明度;
stacked:是否堆叠;
bins:密度;
df.groupby('education').apply(lambda x:x.avg).unstack().T.plot.hist(alpha=0.5,stacked=True,bins=30)
五、箱线图:box
用法一:与“直方图”类似
df.groupby('education').apply(lambda x:x.avg).unstack().T.plot.box()
用法二:
df.boxplot(column='avg',by='education')
六、密度图:kde
df.avg.plot.kde()
七、面积图:area
一般将数据进行分类(数据透视),
df.pivot_table(index='avg',columns='education',values='positonId',aggfunc='count').plot.area()
八、散点图:scatter
按公司分类,以平均值为x轴,数量为y轴
df.groupby('companyId').aggregate(['mean','count']).avg.plot.scatter(x='mean',y='count')
九、散点图矩阵:scatter_matrix(Pandas的函数)
适用于两个以上的参数,两两组合
matrix=df.groupby('companyId').aggregate(['mean','count',max]).avg
pd.plotting.scatter_matrix(matrix.query('count<50'),diagonal='kde')
查询条件:计数小于50
diagonal:修改图的类型(kde:密度图)
十、饼图:pie
df.city.value_counts().plot.pie(figsize=(6,6))
figsize:图的长宽
pandas可视化:各种图的简单使用的更多相关文章
- G6:AntV 的图可视化与图分析
导读 G6 是 AntV 旗下的一款专业级图可视化引擎,它在高定制能力的基础上,提供简单.易用的接口以及一系列设计优雅的图可视化解决方案,是阿里经济体图可视化与图分析的基础设施.今年 AntV 11. ...
- MongoDB在Windows下安装、Shell客户端的使用、Bson扩充的数据类型、MongoVUE可视化工具安装和简单使用、Robomongo可视化工具(2)
一.Windows 下载安装 1.去http://www.mongodb.org/downloads下载,mongodb默认安装在C:\Program Files\MongoDB目录下,到F:\Off ...
- 可视化Tensorboard图中的符号意义
可视化Tensorboard图中的符号意义
- NLP(十二)依存句法分析的可视化及图分析
依存句法分析的效果虽然没有像分词.NER的效果来的好,但也有其使用价值,在日常的工作中,我们免不了要和其打交道.笔者这几天一直在想如何分析依存句法分析的结果,一个重要的方面便是其可视化和它的图分析 ...
- pandas知识点脑图汇总
参考文献: [1]Pandas知识点脑图汇总
- Neo4j属性图模型简单介绍
本文主要是对Neo4j属性图模型简单的介绍. Neo4j是什么? Neo4j是一款是由java语言实现的图数据库,图形数据库将数据以图的数据结构进行存储和管理,并且能够以高度可问的方式优雅地表示任何种 ...
- Pandas可视化
基本绘图:绘图 Series和DataFrame上的这个功能只是使用matplotlib库的plot()方法的简单包装实现.参考以下示例代码 - import pandas as pd import ...
- ubuntu安装mysql可视化工具MySQL-workbench及简单操作
一.使用命令行在ubuntu下安装mysql可视化工具MySQL-workbench Step1:安装MySQL-workbench 方案一:如果你已经装好mysql的相关服务,那么直接使用如下命令即 ...
- Pandas plot出图
1.创建一个Series 这是一个线性的数据,我们随机生成1000个数据,Series 默认的 index 就是从0开始的整数,但是这里我显式赋值以便让大家看的更清楚 >>> imp ...
随机推荐
- String——字符串
首先看一下string的一部分源码吧 public final class String private final char value[]; 我们暂且只看这两行, 第一行String被final修 ...
- vue-cli中的跨域之proxytable
为什么会有跨域? 浏览器有一个叫做同源策略的东西.同源策略限制了从同一个源加载的文档或脚本如何与来自另一个源的资源进行交互.这是一个用于隔离潜在恶意文件的重要安全机制. 同源策略规定了如果两个页面的协 ...
- No!No!No! It's not fashion!
还记得搞怪的hold住姐Miss Lin么,对于人们常规的行为,Miss Lin会挑起夸张的眉毛说:"Oh my God, it's not fashion!".如果程序员圈子里有 ...
- DC-2靶机
DC-2 靶机获取:http://www.five86.com/ 靶机IP:192.168.43.197(arp-scan l) 攻击机器IP:192.168.43.199 在hosts文件里添加:1 ...
- linuxdeploy安装报错
报错内容:checking installation path…fail(检查安装路径) 处理方法:安装在手机自带的存储空间中,则在路径开头加上${ENV_DIR},安装在sdcard中,加上${EX ...
- File Compression and Archiving in linux (linux 中文件的归档)
1. Compressing Files at the Shell Prompt Red Hat Enterprise Linux provides the bzip2, gzip, and zip ...
- laravel为模型中所有查询统一添加WHERE条件
在使用laravel开发web系统的过程,需要在model处为该模型统一添加一个条件或者多个条件,研究了一个laravel的模型类,发现model中有个方法是构建查询的,方法如下: /** * Reg ...
- R 包 rgl 安装失败, 报错 X11 not found but required, configure aborted 及解决方法
R 包 rgl 安装失败, X11 not found but required, configure aborted * installing *source* package ‘rgl’ ... ...
- Shrio使用Jwt达到前后端分离
概述 前后端分离之后,因为HTTP本身是无状态的,Session就没法用了.项目采用jwt的方案后,请求的主要流程如下:用户登录成功之后,服务端会创建一个jwt的token(jwt的这个token中记 ...
- Java 从入门到进阶之路(三)
之前的文章我们介绍了 Java 中的变量和基本数据类型,本章我们来看一下 Java 的运算符和表达式. 计算机的最基本用途之一就是执行数学运算,作为一门计算机语言,Java也提供了一套丰富的运算符来操 ...