数据可视化 seaborn绘图(2)

统计关系可视化

最常用的关系可视化的函数是relplot

seaborn.relplot(x=None, y=None, hue=None, size=None, style=None, data=None, row=None, col=None, col_wrap=None, row_order=None, col_order=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=None, dashes=None, style_order=None, legend='brief', kind='scatter', height=5, aspect=1, facet_kws=None, **kwargs)

Figure-level interface for drawing relational plots onto a FacetGrid.

详细的api解释在此

replot通过参数颜色/色调(hue),大小(size)和形状/风格(style)可以额外表达三个变量的信息.

散点图scatter plot
线图line plot

当数据类型都是numberic的时候,最常用的是scatterplot().

relplot的默认kind是‘scatter’，代表scatterplot。

import seaborn as sns
sns.set()
tips = sns.load_dataset("tips")

我们加载tips这个数据集.这是一个描述了客户用餐及小费的数据集.

下面简要的看一下这个数据集前几行.

tips = sns.load_dataset("tips")
sns.relplot(x="total_bill", y="tip", data=tips);

这时候可以看到我们绘制出了total_bill,tip两种数据的散点图.

现在我们想再在图上添加这个就餐的顾客抽不抽烟.我们可以

sns.relplot(x="total_bill", y="tip", hue="smoker", data=tips);

为了进一步增加辨识度,可以进一步改进如下：

sns.relplot(x="total_bill", y="tip",hue="smoker",style="smoker",data=tips);

此时,颜色和形状表达的都是是否为smoker这一信息.

你也可以用hue和style分别表示不同的信息.

sns.relplot(x="total_bill", y="tip", hue="smoker", style="time", data=tips);

此时,既有蓝色的圆（顾客抽烟,吃的午饭）,也有黄色的圆(顾客不抽烟,吃的午饭).蓝色的×（顾客抽烟,吃的晚饭）,黄色的×（顾客不抽烟,吃的晚饭）.

上面的图hue=‘smoker’.smoker是一个分类变量(categorical)，当hue=‘size’时,size是一个numeric变量.着色方案会更改.

sns.relplot(x="total_bill", y="tip", hue="size", data=tips);

你可以定制化自己的着色方案.

sns.relplot(x="total_bill", y="tip", hue="size", palette="ch:r=-.5,l=.75", data=tips);

size参数可以改变大小.

下面讲线图

有的数据集,你可能想探索一下连续变量的变化情况.这时候线图就派上用场了.

你可以用lineplot()或者relplot(kind='line')

df = pd.DataFrame(dict(time=np.arange(500),
                       value=np.random.randn(500).cumsum()))

看一下这个数据集,time是递增的time,value是浮点数.

对于x变量的相同值，更复杂的数据集将具有多个测量值。seaborn中的默认行为是通过绘制均值和围绕均值的95%置信区间来聚合每个x值上的多个测量值:

fmri = sns.load_dataset("fmri")
sns.relplot(x="timepoint", y="signal", kind="line", data=fmri);

可以通过ci参数控制是否绘制这个区间,因为大数据集下区间的绘制比较耗时.

sns.relplot(x="timepoint", y="signal", kind="line", ci="sd", data=fmri);

sns.relplot(x="timepoint", y="signal", kind="line", ci=None, data=fmri);

类似于点图,也可以利用颜色,形状之类的参数来表达变量信息.

sns.relplot(x="timepoint", y="signal", hue="region", style="event",
dashes=True, markers=True, kind="line", data=fmri);

用facets表达多变量之间的关系

relplot()是基于FacetGrid的,所以很容易做到这一点.那么,你可以在多个轴上绘制数据集.

比如对tips数据集,time的值有Lunch和Dinner。之前我们是用hue/style来表示这个信息的.现在我们可以这么做：

sns.relplot(x="total_bill", y="tip", hue="smoker",
            col="time", data=tips);

从更多的facet绘制数据：

sns.relplot(x="timepoint", y="signal", hue="subject",
            col="region", row="event", height=3,
            kind="line", estimator=None, data=fmri);

sns.relplot(x="timepoint", y="signal", hue="event", style="event",
            col="subject", col_wrap=5,
            height=3, aspect=.75, linewidth=2.5,
            kind="line", data=fmri.query("region == 'frontal'"));

col_wrap表示一行展示几个图.

数据可视化 seaborn绘图(2)的更多相关文章

数据可视化 seaborn绘图(1)
seaborn是基于matplotlib的数据可视化库.提供更高层的抽象接口.绘图效果也更好. 用seaborn探索数据分布绘制单变量分布绘制二变量分布成对的数据关系可视化绘制单变量分布 se ...
Python数据可视化-seaborn库之countplot
在Python数据可视化中,seaborn较好的提供了图形的一些可视化功效. seaborn官方文档见链接:http://seaborn.pydata.org/api.html countplot是s ...
Python图表数据可视化Seaborn：2. 分类数据可视化-分类散点图|分布图（箱型图|小提琴图|LV图表）|统计图（柱状图|折线图）
1. 分类数据可视化 - 分类散点图 stripplot( ) / swarmplot( ) sns.stripplot(x="day",y="total_bill&qu ...
Python图表数据可视化Seaborn：1. 风格| 分布数据可视化-直方图| 密度图| 散点图
conda install seaborn 是安装到jupyter那个环境的 1. 整体风格设置对图表整体颜色.比例等进行风格设置,包括颜色色板等调用系统风格进行数据可视化 set() / se ...
Python图表数据可视化Seaborn：3. 线性关系数据| 时间线图表| 热图
1. 线性关系数据可视化 lmplot( ) import numpy as np import pandas as pd import matplotlib.pyplot as plt import ...
Python图表数据可视化Seaborn：4. 结构化图表可视化
1.基本设置 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns ...
Python数据可视化-seaborn
详细介绍可以看seaborn官方API和example galler. 1 set_style( ) set( ) set_style( )是用来设置主题的,Seaborn有五个预设好的主题: d ...
《Python数据分析》笔记——数据可视化
数据可视化 matplotlib绘图入门为了使用matplotlib来绘制基本图像,需要调用matplotlib.pyplot子库中的plot()函数 import matplotlib.pyplo ...
seaborn 数据可视化(一）连续型变量可视化
一.综述 Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,图像也更加美观,本文基于seaborn官方API还有自己的一些理解. 1.1.样式控制: ...

随机推荐

scrum冲刺
小组第一次冲刺任务及其完成情况描述: 这次主要是先构建一个框架,然后就是完成首页的一些代码编写,能够基本实现首页的注册.登陆以及一些之后完成的内部构建. 在第一次冲刺任务中的收获和体会,以后如何改进的 ...
alfred3配置
搜索功能配置 github https://github.com/search?utf8=%E2%9C%93&q={query} github'{query}' g baidu http:// ...
#224 Profile Lookup (for in & if )
我们有一个对象数组,里面存储着通讯录. 函数 lookUp 有两个预定义参数:firstName值和prop属性 . 函数将会检查通讯录中是否存在一个与传入的 firstName 相同的联系人.如果存 ...
Jeecg框架简介
官方地址:http://www.jeecg.org/
Jenkins pipeline 并行执行任务流
笔者在<Jenkins 在声明式 pipeline 中并行执行任务>一文中介绍了如何在声明式 pipeline 中执行并行的任务.前一段时间,Jenkins 发布了 1.3 版的声明式 p ...
剑指offer面试题15：链表中倒数第K个节点
题目:输入一个链表,输出该链表的倒数第K个节点.为了符合大多数人的习惯,本题从1开始计数,即链表尾节点是倒数第一个节点. 解题思路: 解法一:一般情况下,单向链表无法从后一个节点获取到它前面的节点,可 ...
MSMQ队列的简单使用
微软消息队列-MicroSoft Message Queue(MSMQ) 使用感受:简单. 一.windows安装MSMQ服务控制面板->控制面板->所有控制面板项->程序和功能- ...
【渗透攻防】千变万化的WebShell
前言WebShell就是以asp.php.jsp或者cgi等网页文件形式存在的一种命令执行环境,也可以将其称做为一种网页后门.本篇文章将带大家学习如何获取WebShell,如何隐藏WebShell,有 ...
脑残式网络编程入门(五)：每天都在用的Ping命令，它到底是什么？
本文引用了公众号纯洁的微笑作者奎哥的技术文章,感谢原作者的分享. 1.前言老于网络编程熟手来说,在测试和部署网络通信应用(比如IM聊天.实时音视频等)时,如果发现网络连接超时,第一时间想到的就是 ...
12、json、GridView、缓存
1.解析json数据: public class PhotosData { public int retcode; public PhotosInfo data; public class Photo ...

数据可视化 seaborn绘图(2)

数据可视化 seaborn绘图(2)的更多相关文章

随机推荐

热门专题