pandas可视化:各种图的简单使用
一、Matplotlib中几种图的名字
- 折线图:plot
- 柱形图:bar
- 直方图:hist
- 箱线图:box
- 密度图:kde
- 面积图:area
- 散点图:scatter
- 散点图矩阵:scatter_matrix
- 饼图:pie
二、折线图:plot
平均值需要先排序后出出图
df.avg.value_counts().sort_index().plot()
三、柱形图:bar
可先做数据透视,然后生成柱形图
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.bar()
如果是要做堆叠柱形图,则可设置bar()的参数
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.bar(stacked=True)
如果是要做成条形图,则可修改bar()方法为bar()
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.barh()
四、直方图:hist
df.avg.plot.hist()
以“education”字段多维分析,对平均值绘制直方图,
alpha:图形透明度;
stacked:是否堆叠;
bins:密度;
df.groupby('education').apply(lambda x:x.avg).unstack().T.plot.hist(alpha=0.5,stacked=True,bins=30)
五、箱线图:box
用法一:与“直方图”类似
df.groupby('education').apply(lambda x:x.avg).unstack().T.plot.box()
用法二:
df.boxplot(column='avg',by='education')
六、密度图:kde
df.avg.plot.kde()
七、面积图:area
一般将数据进行分类(数据透视),
df.pivot_table(index='avg',columns='education',values='positonId',aggfunc='count').plot.area()
八、散点图:scatter
按公司分类,以平均值为x轴,数量为y轴
df.groupby('companyId').aggregate(['mean','count']).avg.plot.scatter(x='mean',y='count')
九、散点图矩阵:scatter_matrix(Pandas的函数)
适用于两个以上的参数,两两组合
matrix=df.groupby('companyId').aggregate(['mean','count',max]).avg
pd.plotting.scatter_matrix(matrix.query('count<50'),diagonal='kde')
查询条件:计数小于50
diagonal:修改图的类型(kde:密度图)
十、饼图:pie
df.city.value_counts().plot.pie(figsize=(6,6))
figsize:图的长宽
pandas可视化:各种图的简单使用的更多相关文章
- G6:AntV 的图可视化与图分析
导读 G6 是 AntV 旗下的一款专业级图可视化引擎,它在高定制能力的基础上,提供简单.易用的接口以及一系列设计优雅的图可视化解决方案,是阿里经济体图可视化与图分析的基础设施.今年 AntV 11. ...
- MongoDB在Windows下安装、Shell客户端的使用、Bson扩充的数据类型、MongoVUE可视化工具安装和简单使用、Robomongo可视化工具(2)
一.Windows 下载安装 1.去http://www.mongodb.org/downloads下载,mongodb默认安装在C:\Program Files\MongoDB目录下,到F:\Off ...
- 可视化Tensorboard图中的符号意义
可视化Tensorboard图中的符号意义
- NLP(十二)依存句法分析的可视化及图分析
依存句法分析的效果虽然没有像分词.NER的效果来的好,但也有其使用价值,在日常的工作中,我们免不了要和其打交道.笔者这几天一直在想如何分析依存句法分析的结果,一个重要的方面便是其可视化和它的图分析 ...
- pandas知识点脑图汇总
参考文献: [1]Pandas知识点脑图汇总
- Neo4j属性图模型简单介绍
本文主要是对Neo4j属性图模型简单的介绍. Neo4j是什么? Neo4j是一款是由java语言实现的图数据库,图形数据库将数据以图的数据结构进行存储和管理,并且能够以高度可问的方式优雅地表示任何种 ...
- Pandas可视化
基本绘图:绘图 Series和DataFrame上的这个功能只是使用matplotlib库的plot()方法的简单包装实现.参考以下示例代码 - import pandas as pd import ...
- ubuntu安装mysql可视化工具MySQL-workbench及简单操作
一.使用命令行在ubuntu下安装mysql可视化工具MySQL-workbench Step1:安装MySQL-workbench 方案一:如果你已经装好mysql的相关服务,那么直接使用如下命令即 ...
- Pandas plot出图
1.创建一个Series 这是一个线性的数据,我们随机生成1000个数据,Series 默认的 index 就是从0开始的整数,但是这里我显式赋值以便让大家看的更清楚 >>> imp ...
随机推荐
- hdu1241 油田计数
具体思路:求联通块,在"@“的周围进行dfs,使用8个方向向量来代表搜索的方向 贴一下我的主要代码段: int dir[8][2]={{1,1},{-1,-1},{1,-1},{-1,1}, ...
- DedeCMS 5.7 sp1远程文件包含漏洞(CVE-2015-4553)
DedeCMS 5.7 sp1远程文件包含漏洞(CVE-2015-4553) 一.漏洞描述 该漏洞在/install/index.php(index.php.bak)文件中,漏洞起因是$$符号使用不当 ...
- Docker入门-搭建docker私有仓库
Docker Hub 目前Docker官方维护了一个公共仓库Docker Hub,其中已经包括了数量超过15000个镜像.大部分需求都可以通过在Docker Hub中直接下载镜像来使用. 注册登录 可 ...
- Apex 获取真正的IP地址
代码如下 declare l_ip varchar2(15); begin if OWA_UTIL.GET_CGI_ENV('X-FORWARDED-FOR') is not null then l_ ...
- git码云的使用基础(为了以后更好的协同操作)
git手册 安装教程 windows 不需要什么操作点点点就好 设置一个文件夹当成本地仓库 第一次上传 git init# 创建一个本地的仓库 git add. 当前文件夹下所有内容# 添加到暂存区 ...
- 宁远电子瑞芯微RK3399开发板DLT3399A底层接口调用
GPIO口控制 在DLT3399A板卡正面写有GPIO和UART4_1V8丝印的接口,并看到板子反面对应的引脚gpio丝印,选择相对应的gpio控制节点,接口位置如下图所示: 1.dlt3399a上 ...
- net start mysql
net start mysql 解决的方法: 如何以管理员身份打开黑窗口 左下角开始菜单,找到小娜,cmd 回车, 命令提示符右击,以管理员身份打开 依次输入下面两行代码 mysqld -instal ...
- Linux权限管理(7)
权限的基本介绍: rwx权限详解: rwx作用到文件: [r]:代表可读,可以读取.查看 [w]:代表可写,可以修改,但不代表可以删除该文件,删除一个文件的前提条件是对该文件所在的目录有写权限才能删除 ...
- python+unittest框架第四天unittest之批量执行案例
今天开始批量执行用例~,场景是这样的: 工作中我们可能有多个模块文件(.py)这些文件根据不同的业务类型或功能,测试案例分布在不同的模块文件下.前面的小示例中,我们的测试用例都是在一个文件中,直接运行 ...
- bilibili弹幕爬取与比对分析
最近受人之托研究了下b站的数据爬取做个小工具,最后朋友说不需要了,本着开源共享的原则,将研究成果与大家分享一波,话不多说直接上干货 需求分析 给定up主uid和用户uid,爬取用户在该up主所有视频中 ...