从静态到动态化,Python数据可视化中的Matplotlib和Seaborn
本文分享自华为云社区《Python数据可视化大揭秘:Matplotlib和Seaborn高效应用指南》,作者: 柠檬味拥抱。
安装Matplotlib和Seaborn
首先,确保你已经安装了Matplotlib和Seaborn库。如果没有安装,可以使用以下命令进行安装:
pip install matplotlib seaborn
Matplotlib基础
Matplotlib是一个灵活的绘图库,支持多种图表类型。以下是一个简单的折线图的代码示例:
import matplotlib.pyplot as plt # 创建数据
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10] # 绘制折线图
plt.plot(x, y, label='Line Chart') # 添加标题和标签
plt.title('Simple Line Chart')
plt.xlabel('X-axis')
plt.ylabel('Y-axis') # 显示图例
plt.legend() # 显示图表
plt.show()
上述代码首先导入Matplotlib库,然后创建了一组简单的数据并使用plt.plot
绘制了折线图。接着,添加了标题和坐标轴标签,并通过plt.legend
显示图例。最后,通过plt.show
显示图表。
Seaborn的美化
Seaborn是基于Matplotlib的统计数据可视化库,它提供了更简单的接口和更美观的默认样式。以下是一个使用Seaborn创建直方图的代码示例:
import seaborn as sns
import matplotlib.pyplot as plt # 创建数据
data = [1, 2, 2, 3, 3, 3, 4, 4, 5] # 使用Seaborn创建直方图
sns.histplot(data, bins=5, kde=True, color='skyblue') # 添加标题和标签
plt.title('Histogram with Seaborn')
plt.xlabel('Values')
plt.ylabel('Frequency') # 显示图表
plt.show()
在这个例子中,使用seaborn.histplot
创建了直方图,并通过参数设置调整了一些样式,如bins
指定柱子的数量,kde
添加核密度估计。此外,Matplotlib的基础功能仍然可以与Seaborn一起使用。
定制化和进阶功能
Matplotlib的子图和定制化
Matplotlib允许你在同一图表上绘制多个子图,通过plt.subplot
实现。以下是一个使用子图的例子:
import matplotlib.pyplot as plt
import numpy as np # 创建数据
x = np.linspace(0, 2 * np.pi, 100)
y1 = np.sin(x)
y2 = np.cos(x) # 创建子图
plt.subplot(2, 1, 1) # 两行一列,当前选中第一个子图
plt.plot(x, y1, label='Sin')
plt.title('Sin Function')
plt.legend() plt.subplot(2, 1, 2) # 两行一列,当前选中第二个子图
plt.plot(x, y2, label='Cos')
plt.title('Cos Function')
plt.legend() plt.tight_layout() # 调整子图布局,防止重叠
plt.show()
在这个例子中,使用plt.subplot
创建了两个子图,分别绘制了正弦和余弦函数。
Matplotlib还提供了大量的定制化选项,包括颜色、线型、标记等。例如:
plt.plot(x, y, color='red', linestyle='--', marker='o', label='Data Points')
这将绘制一条红色虚线,带有圆形标记的线条。
Seaborn的高级绘图功能
Seaborn提供了一些高级绘图功能,如Pair Plots、Heatmaps等,可以更全面地了解数据之间的关系。
import seaborn as sns
import matplotlib.pyplot as plt # 使用Seaborn创建Pair Plot
iris = sns.load_dataset('iris')
sns.pairplot(iris, hue='species', markers=['o', 's', 'D']) plt.show()
这个例子中,使用Seaborn的pairplot
创建了一个Pair Plot,展示了Iris数据集中不同物种之间的关系。
保存图表
无论是Matplotlib还是Seaborn,都支持将图表保存为图像文件。例如,使用plt.savefig
保存Matplotlib图表:
plt.savefig('my_plot.png')
性能优化
对于大型数据集,性能可能成为一个问题。Matplotlib和Seaborn都提供了一些优化选项,如使用plt.plot
的marker
参数控制标记的显示,以提高渲染性能。
plt.plot(x, y, marker='.', markersize=1)
数据可视化的交互性
在实际应用中,交互性是数据可视化中的重要部分,能够增强用户体验并提供更深层次的数据探索。使用Matplotlib和Seaborn,你可以通过其他库或工具来实现交互性,如Plotly、Bokeh等。
使用Plotly创建交互性图表
Plotly是一个强大的交互性绘图库,可以与Matplotlib和Seaborn无缝集成。以下是一个简单的例子:
import plotly.express as px # 创建数据
df = px.data.iris() # 使用Plotly创建交互性散点图
fig = px.scatter(df, x='sepal_width', y='sepal_length', color='species', size='petal_length', hover_data=['petal_width']) # 显示图表
fig.show()
这个例子中,使用Plotly的scatter
函数创建了一个交互性的散点图,通过hover_data
参数添加了悬停信息。
Bokeh的交互性绘图
Bokeh是另一个强大的交互性绘图库,支持大规模数据集的交互式可视化。以下是一个简单的Bokeh例子:
from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource # 创建数据
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10] # 创建Bokeh图表
source = ColumnDataSource(data=dict(x=x, y=y))
p = figure(title='Interactive Line Chart', x_axis_label='X-axis', y_axis_label='Y-axis') # 添加线条
p.line('x', 'y', source=source, line_width=2) # 显示图表
show(p)
这个例子中,使用Bokeh的figure
和line
函数创建了一个交互性的折线图。
结合使用Matplotlib/Seaborn和交互性库
你还可以结合使用Matplotlib或Seaborn与交互性库,以在静态图表中添加交互性元素,提供更丰富的用户体验。
import matplotlib.pyplot as plt
from mplcursors import cursor # 创建数据
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10] # 绘制散点图
plt.scatter(x, y, label='Data Points') # 添加标题和标签
plt.title('Interactive Scatter Plot')
plt.xlabel('X-axis')
plt.ylabel('Y-axis') # 使用mplcursors添加悬停信息
cursor(hover=True) # 显示图例
plt.legend() # 显示图表
plt.show()
在这个例子中,使用了mplcursors
库来添加悬停信息,通过悬停鼠标可以查看数据点的具体数值。
高级主题:时间序列可视化和面向对象的绘图
时间序列可视化
在许多数据分析任务中,我们需要处理时间序列数据。Matplotlib和Seaborn提供了强大的工具来可视化时间序列。
import pandas as pd
import matplotlib.pyplot as plt # 创建时间序列数据
date_rng = pd.date_range(start='2024-01-01', end='2024-01-10', freq='D')
data = {'value': [1, 3, 7, 2, 5, 8, 4, 6, 9, 10]}
df = pd.DataFrame(data, index=date_rng) # 绘制时间序列折线图
plt.plot(df.index, df['value'], marker='o', linestyle='-', color='b') # 添加标题和标签
plt.title('Time Series Plot')
plt.xlabel('Date')
plt.ylabel('Value') # 日期标签自动格式化
plt.gcf().autofmt_xdate() # 显示图表
plt.show()
在这个例子中,我们使用了Pandas创建了一个简单的时间序列数据,并使用Matplotlib绘制了折线图。通过autofmt_xdate
可以自动调整日期标签的格式,确保它们在图上显示得更加美观。
面向对象的绘图
Matplotlib支持两种不同的绘图接口:MATLAB风格的plt
接口和面向对象的接口。面向对象的接口更为灵活,能够实现更高级的定制化。
import numpy as np
import matplotlib.pyplot as plt # 创建数据
x = np.linspace(0, 2 * np.pi, 100)
y1 = np.sin(x)
y2 = np.cos(x) # 创建Figure和Axes对象
fig, ax = plt.subplots() # 在Axes对象上绘制折线图
line1, = ax.plot(x, y1, label='Sin')
line2, = ax.plot(x, y2, label='Cos') # 添加标题和标签
ax.set_title('Sine and Cosine Functions')
ax.set_xlabel('X-axis')
ax.set_ylabel('Y-axis') # 显示图例
ax.legend() # 显示图表
plt.show()
在这个例子中,我们使用了面向对象的绘图方式,通过subplots
创建了Figure和Axes对象,然后在Axes对象上绘制了两条折线。这种方式可以更灵活地控制图表的各个元素。
性能和效率优化
对于大规模的数据集或复杂的图表,性能和效率成为关键问题。以下是一些优化技巧:
使用NumPy和Pandas优化数据处理: 尽可能使用向量化操作,以提高数据处理效率。
使用
plt.tight_layout()
: 该函数能够自动调整子图的布局,避免重叠。避免绘制过多数据点: 对于大型数据集,可以通过降采样等方法减少数据点的数量。
异步渲染: 在一些情况下,使用异步渲染可以提高交互性图表的响应速度。
交互性和动态可视化
在一些场景中,静态图表无法完全满足需求,需要使用交互性和动态可视化来更好地与数据进行互动。
使用Bokeh创建动态可视化
Bokeh是一个强大的交互式可视化库,支持创建动态可视化。以下是一个简单的Bokeh动态图表的例子:
from bokeh.plotting import figure, curdoc
from bokeh.models import ColumnDataSource
from bokeh.driving import count # 创建数据源
source = ColumnDataSource(data={'x': [], 'y': []}) # 创建Bokeh图表
p = figure(title='Dynamic Plot', width=800, height=400)
p.circle(x='x', y='y', size=10, color='navy', alpha=0.5, source=source) # 定义动态更新函数
@count()
def update(i):
new_data = {'x': [i], 'y': [i % 10]} # 更新数据
source.stream(new_data, rollover=20) # 更新数据源 # 添加定时器,每100毫秒触发一次更新
curdoc().add_periodic_callback(update, 100) # 显示图表
curdoc().title = 'Dynamic Plot'
curdoc().add_root(p)
在这个例子中,使用Bokeh创建了一个动态散点图,通过ColumnDataSource
更新数据。使用add_periodic_callback
函数定时触发数据更新,实现了动态可视化。
使用Plotly创建交互性动画
Plotly也提供了创建交互性动画的功能,以下是一个简单的例子:
import plotly.express as px
import pandas as pd # 创建数据
df = pd.DataFrame({'x': range(10), 'y': [i % 10 for i in range(10)]}) # 创建动画散点图
fig = px.scatter(df, x='x', y='y', animation_frame=df.index, size_max=50, range_x=[0, 10], range_y=[0, 10]) # 显示图表
fig.show()
在这个例子中,使用Plotly的scatter
函数创建了一个动画散点图,通过animation_frame
参数指定了动画的帧。
输出和分享可视化
一旦创建了令人满意的可视化,你可能希望将其分享给他人。Matplotlib、Seaborn、Bokeh和Plotly都提供了保存图表的功能,可以将图表保存为图片或HTML文件。
# 保存Matplotlib图表
plt.savefig('my_plot.png') # 保存Bokeh图表
from bokeh.io import output_file, save
output_file('my_bokeh_plot.html')
save(p) # 保存Plotly图表
fig.write_html('my_plotly_plot.html')
这些方法使得你可以方便地将可视化结果分享给他人,或者嵌入到网页中。
实际应用示例:舆情分析的交互性可视化
让我们通过一个实际的应用场景,结合Matplotlib、Seaborn、Bokeh和Plotly,来展示如何创建一个交互性的舆情分析可视化。
假设我们有一份包含日期、情感分数和新闻数量的数据集,我们希望通过可视化展示每天的舆情走势,并提供交互性操作。
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from bokeh.plotting import figure, show
import plotly.express as px # 创建示例数据集
data = {'Date': pd.date_range(start='2024-01-01', end='2024-01-10'),
'Sentiment': [0.2, -0.1, 0.5, -0.3, 0.6, -0.2, 0.1, 0.4, -0.5, 0.3],
'News_Count': [10, 8, 12, 6, 15, 9, 11, 14, 7, 13]} df = pd.DataFrame(data) # Matplotlib折线图
plt.figure(figsize=(10, 5))
plt.plot(df['Date'], df['Sentiment'], label='Sentiment Score', marker='o')
plt.plot(df['Date'], df['News_Count'], label='News Count', marker='o')
plt.title('Sentiment Analysis Over Time')
plt.xlabel('Date')
plt.ylabel('Score/Count')
plt.legend()
plt.show() # Seaborn折线图
plt.figure(figsize=(10, 5))
sns.lineplot(x='Date', y='Sentiment', data=df, label='Sentiment Score', marker='o')
sns.lineplot(x='Date', y='News_Count', data=df, label='News Count', marker='o')
plt.title('Sentiment Analysis Over Time (Seaborn)')
plt.xlabel('Date')
plt.ylabel('Score/Count')
plt.legend()
plt.show() # Bokeh交互性折线图
p = figure(title='Sentiment Analysis Over Time', x_axis_label='Date', y_axis_label='Score/Count', width=800, height=400)
p.line(df['Date'], df['Sentiment'], legend_label='Sentiment Score', line_width=2, line_color='blue')
p.circle(df['Date'], df['Sentiment'], size=8, color='blue')
p.line(df['Date'], df['News_Count'], legend_label='News Count', line_width=2, line_color='green')
p.square(df['Date'], df['News_Count'], size=8, color='green')
p.legend.location = 'top_left'
show(p) # Plotly交互性折线图
fig = px.line(df, x='Date', y=['Sentiment', 'News_Count'], labels={'value': 'Score/Count'},
title='Sentiment Analysis Over Time (Plotly)', markers=True)
fig.show()
在这个示例中,我们使用了Matplotlib、Seaborn、Bokeh和Plotly创建了相同的舆情分析可视化,其中Bokeh和Plotly提供了交互性操作,可以缩放、平移、悬停查看数值等。
这种综合运用不同库的方式,可以根据具体需求选择最适合的工具,为数据科学和分析提供更全面、多样化的可视化支持。
总结
本文详细介绍了如何使用Python中的Matplotlib、Seaborn、Bokeh和Plotly等库进行数据可视化,并深入探讨了一系列主题,涵盖了从基础的静态图表到高级的交互性和动态可视化的方方面面。以下是本文的主要总结:
Matplotlib和Seaborn基础: 学习了使用Matplotlib和Seaborn创建各种静态图表的基本方法,包括折线图、直方图和散点图。
高级主题: 涵盖了时间序列可视化、面向对象的绘图和性能优化等高级主题,使读者能够更好地应对不同场景下的数据可视化任务。
交互性和动态可视化: 介绍了Bokeh和Plotly这两个强大的交互性可视化库,展示了如何创建动态可视化和交互性图表,以更灵活地与数据进行互动。
实际应用示例: 通过一个舆情分析的实际应用场景,演示了如何结合多个库创建一个综合、交互性的可视化,为读者提供了在实际工作中应用所学知识的示范。
输出和分享可视化: 介绍了如何保存可视化结果为图片或HTML文件,以便分享或嵌入到网页中,帮助读者将成果展示给他人。
通过这篇综合性的指南,读者可以全面了解数据可视化的基础知识,并学会如何应用不同的库和技术,使得数据科学和分析工作更具深度和广度。希望本文能够激发读者对数据可视化的兴趣,并为他们在实际项目中提供有力的工具和方法。
从静态到动态化,Python数据可视化中的Matplotlib和Seaborn的更多相关文章
- Python数据可视化-seaborn库之countplot
在Python数据可视化中,seaborn较好的提供了图形的一些可视化功效. seaborn官方文档见链接:http://seaborn.pydata.org/api.html countplot是s ...
- 推荐一款Python数据可视化神器
1. 前言 在日常工作中,为了更直观的发现数据中隐藏的规律,察觉到变量之间的互动关系,人们常常借助可视化帮助我们更好的给他人解释现象,做到一图胜千文的说明效果. 在Python中,常见的数据可视化库有 ...
- Python数据可视化编程实战——导入数据
1.从csv文件导入数据 原理:with语句打开文件并绑定到对象f.不必担心在操作完资源后去关闭数据文件,with的上下文管理器会帮助处理.然后,csv.reader()方法返回reader对象,通过 ...
- Python数据可视化——使用Matplotlib创建散点图
Python数据可视化——使用Matplotlib创建散点图 2017-12-27 作者:淡水化合物 Matplotlib简述: Matplotlib是一个用于创建出高质量图表的桌面绘图包(主要是2D ...
- Python数据可视化编程实战pdf
Python数据可视化编程实战(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1vAvKwCry4P4QeofW-RqZ_A 提取码:9pcd 复制这段内容后打开百度 ...
- 【数据科学】Python数据可视化概述
注:很早之前就打算专门写一篇与Python数据可视化相关的博客,对一些基本概念和常用技巧做一个小结.今天终于有时间来完成这个计划了! 0. Python中常用的可视化工具 Python在数据科学中的地 ...
- Python数据可视化的四种简易方法
摘要: 本文讲述了热图.二维密度图.蜘蛛图.树形图这四种Python数据可视化方法. 数据可视化是任何数据科学或机器学习项目的一个重要组成部分.人们常常会从探索数据分析(EDA)开始,来深入了解数据, ...
- python --数据可视化(一)
python --数据可视化 一.python -- pyecharts库的使用 pyecharts--> 生成Echarts图标的类库 1.安装: pip install pyecharts ...
- python 数据可视化
一.基本用法 import numpy as np import matplotlib.pyplot as plt x = np.linspace(-1,1,50) # 生成-1到1 ,平分50个点 ...
- Python数据可视化库-Matplotlib(一)
今天我们来学习一下python的数据可视化库,Matplotlib,是一个Python的2D绘图库 通过这个库,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率图,条形图,错误图,散点图等等 废 ...
随机推荐
- JS Leetcode 263. 丑数 题解分析,来认识有趣的丑数吧
壹 ❀ 引 本题来自LeetCode263. 丑数,难度简单,题目描述如下: 给你一个整数 n ,请你判断 n 是否为 丑数 .如果是,返回 true :否则,返回 false . 丑数 就是只包含质 ...
- 【Unity3D】水波特效
1 水波特效原理 水面特效 中基于 Shader Graph 实现了模拟水面特效,包含波纹.起伏.折射.泡沫等细节,本文将基于屏幕后处理实现环形水波特效. 水波特效属于 Unity3D 后处理 ...
- 微信小程序获取本日、本周、本月、本年时间段
原文链接 https://cslaoxu.vip/110.html 说明 最近需要用到统计不同时间段内的记录数,所以找了一下现成的工具类.下面就演示一下如何引用到实际项目中. 详细用法请参考:http ...
- Qt+MySql开发笔记:Qt5.9.3的mingw32版本编译MySql8版本驱动并Demo连接数据库测试
前言 之前特定的mysql版本msvc版本已经调通了,但是为了更好的跨平台,所以选择用mingw32版本,于是需要编译mysql驱动的mingw32版本的驱动库,以便提供给qt连接mysql使用. ...
- 基于java的图书管理系统
基于java的图书管理系统 项目概述 使用数组存储数据实现一个图书管理系统,完成的功能有增加图书.删除图书.更新图书.查询图书.图书列表.增删改查 登陆注册 首页 图书更新 图书列表 开发工具/技术 ...
- VMware虚拟机Ubuntu系统连接网络过程
网络和Internet设置--高级网络设置--更多网络适配器选项--WLAN. 右键选择属性--共享,勾选允许连接,选择VMnet8.(若勾选了其它,之后再想换回来,可以先取消勾选,点确定,再进入勾选 ...
- 【Azure Developer】使用 Azure PowerShell 执行 Azure 表存储操作时遇见的4个问题
要使用PowerShell操作Azure的表存储,需要经过以下步骤: 1:必须安装 Az 和 AzTable 模块.安装命令为: #安装 Az 模块 Install-Module -Name Az - ...
- nebula-br local-store 模式,快速搭建主备集群实践
因为线上图数据库目前为单集群,数据量比较大,有以下缺点: 单点风险,一旦集群崩溃或者因为某些查询拖垮整个集群,就会导致所有图操作受影响 很多优化类但会影响读写的操作不好执行,比如:compact.ba ...
- 百度爱番番基于图技术、流式计算的实时CDP建设实践
导读:随着营销3.0时代的到来,企业愈发需要依托强大CDP能力解决其严重的数据孤岛问题,帮助企业加温线索.促活客户.但什么是CDP.好的CDP应该具备哪些关键特征?本文在回答此问题的同时,详细讲述了爱 ...
- IDA sp-analysis failed
目录 概述 问题描述 排查过程 概述 学习任何一个技术,都是会遇到各种问题的,那么现在就有 sp-analysis failed 问题描述 IDA在载入文件之后,出现如下注释 但是可以正常F5,不过只 ...