Matplotlib 使用 - 《Python 数据科学手册》学习笔记
一、引入
import matplotlib as mpl
import matplotlib.pyplot as plt
二、配置
1、画图接口
Matplotlib 有两种画图接口:
(1)一个是便捷的 MATLAB 风格接口
(2)功能更强大的面向对象接口【推荐,下文都以这个为例】
在面向对象接口中,画图函数不再受到当前“活动”图形或坐标轴的限制,而变成了显式的 Figure 和 Axes 的方法(一个Figure
画布下可以有多个Axes
子图)。
2、静态 or 交互
%matplotlib notebook
会在 Notebook 中启动交互式图形。
%matplotlib inline
会在 Notebook 中启动静态图形。
下文统一使用%matplotbib inline。
3、样式表
默认是经典(classic)的 Matplotlib 风格:
plt.style.use('classic')
更多风格:
plt.style.available
# ['_classic_test',
'bmh',
'classic',
'dark_background',
'fast',
'fivethirtyeight',
'ggplot',
'grayscale',
'seaborn-bright',
'seaborn-colorblind',
'seaborn-dark-palette',
'seaborn-dark',
'seaborn-darkgrid',
'seaborn-deep',
'seaborn-muted',
'seaborn-notebook',
'seaborn-paper',
'seaborn-pastel',
'seaborn-poster',
'seaborn-talk',
'seaborn-ticks',
'seaborn-white',
'seaborn-whitegrid',
'seaborn',
'Solarize_Light2',
'tableau-colorblind10']
也可自定义样式文件:
.mplstyle
4、导出
fig.savefig('my_figure.png')
支持的格式可以通过这个查看:
fig.canvas.get_supported_filetypes()
二、用法
1、线形图
fig = plt.figure()
ax = plt.axes()
x = np.linspace(0, 10, 1000)
ax.plot(x, np.cos(x),color='blue',linestyle='dotted',label='cos(x)');
ax.plot(x, np.sin(x),color='0.9',label='sin(x)');
# ----- 调整线条 -----
# color - 调整线条的颜色
ax.plot(x, np.sin(x - 0), color='blue') # 标准颜色名称
ax.plot(x, np.sin(x - 1), color='g') # 缩写颜色代码(rgbcmyk)
ax.plot(x, np.sin(x - 2), color='0.75') # 范围在0~1的灰度值
ax.plot(x, np.sin(x - 3), color='#FFDD44') # 十六进制(RRGGBB,00~FF)
ax.plot(x, np.sin(x - 4), color=(1.0,0.2,0.3)) # RGB元组,范围在0~1
ax.plot(x, np.sin(x - 5), color='chartreuse'); # HTML颜色名称
# linestyle - 调整线条的风格
ax.plot(x, x + 0, linestyle='solid')
ax.plot(x, x + 1, linestyle='dashed')
ax.plot(x, x + 2, linestyle='dashdot')
ax.plot(x, x + 3, linestyle='dotted');
# 你可以用下面的简写形式
ax.plot(x, x + 4, linestyle='-') # 实线
ax.plot(x, x + 5, linestyle='--') # 虚线
ax.plot(x, x + 6, linestyle='-.') # 点划线
ax.plot(x, x + 7, linestyle=':'); # 实点线
# ----- 调整坐标轴 -----
# 坐标轴上下限
ax.xlim(-1, 11)
ax.ylim(-1.5, 1.5);
ax.ylim(1.5, -1.5); # 坐标逆序
ax.axis([-1, 11, -1.5, 1.5]);
# 紧凑模式
ax.axis('tight');
# 横纵坐标 1:1
ax.axis('equal');
# ----- 调整标题 -----
# 设置图形标题、横纵坐标标题
ax.title("A Sine Curve")
ax.xlabel("x")
ax.ylabel("sin(x)");
# ----- 图例(跟 label 属性挂钩) -----
ax.legend()
# 详细属性请查文档
ax.legend(loc='upper left', frameon=True, ncol=2, fancybox=True, framealpha=1, shadow=True, borderpad=1)
# 选择图例显示的元素
# 略
# 在图例中显示不同尺寸的点
# 略
# 同时显示多个图例
# 略
2、散点图(scatter plot)
(1)方法一:
跟上面线形图的区别在于 ax.plot() 的第三个参数传了个字符。
fig = plt.figure()
ax = plt.axes()
x = np.linspace(0, 10, 30)
ax.plot(x, np.sin(x), 'o', color='black');
# 第三个参数可能值:['o', '.', ',', 'x', '+', 'v', '^', '<', '>', 's', 'd']
(2)方法二:plt.scatter
略
取舍:面对大型数据集时,plt.plot 方法比 plt.scatter 方法性能要好。
3、误差线
fig = plt.figure()
ax = plt.axes()
x = np.linspace(0, 10, 50)
dy = np.linspace(0, 1, 50)
y = np.sin(x)
# 1、基本误差线
ax.errorbar(x, y, yerr=dy, fmt='o', color='black', ecolor='lightgray', elinewidth=3, capsize=0);
# 经验:让误差线的颜色比数据点的颜色浅一点效果会非常好,尤其是在那些比较密集的图形中
# 2、连续误差线
略
4、密度图与等高线图
fig = plt.figure()
ax = plt.axes()
# 1、用 plt.contour 画等高线图
def f(x, y):
return np.sin(x) ** 10 + np.cos(10 + y * x) * np.cos(x)
x = np.linspace(0, 5, 50)
y = np.linspace(0, 5, 40)
X, Y = np.meshgrid(x, y)
Z = f(X, Y)
ax.contour(X, Y, Z, colors='black');
# 当图形中只使用一种颜色时,默认使用虚线表示负数,使用实线表示正数。
# 单色(深浅)
ax.contour(X, Y, Z, 20, colors='black');
# 双色(红灰)(RdGy = Red-Gray = 红灰)
ax.contour(X, Y, Z, 20, cmap='RdGy'); # 见下图1
# 2、用 plt.contourf 画带有填充色的等高线图
ax.contourf(X, Y, Z, 20, cmap='RdGy'); # 见下图2
# 3、更复杂的图形用 plt.imshow
# 略
# plt.contour、plt.contourf 与 plt.imshow 这三个函数组合起来之后,就打开了用二维图画三维数据的无尽可能。
5、频次直方图
(1)一维
fig = plt.figure()
ax = plt.axes()
data = np.random.randn(1000)
# 1、hist 画单个频次直方图
ax.hist(data, bins=30, normed=11, alpha=0.5, histtype='stepfilled', color='steelblue', edgecolor='none');
# 2、hist 画多个频次直方图 (见下图)
x1 = np.random.normal(0, 0.8, 1000)
x2 = np.random.normal(-2, 1, 1000)
x3 = np.random.normal(3, 2, 1000)
kwargs = dict(histtype='stepfilled', alpha=0.3, normed=True, bins=40)
ax.hist(x1, **kwargs)
ax.hist(x2, **kwargs)
ax.hist(x3, **kwargs);
# 3、只计算数值结果不画图
counts, bin_edges = np.histogram(data, bins=5)
print(counts, bin_edges)
# [ 64 372 419 138 7] [-2.71435952 -1.43623111 -0.1581027 1.12002572 2.39815413 3.67628254]
(2)二维
fig = plt.figure()
ax = plt.axes()
mean = [0, 0]
cov = [[1, 1], [1, 2]]
# 用多元高斯分布(multivariate Gaussian distribution)生成 x 轴与 y 轴的样本数据:
x, y = np.random.multivariate_normal(mean, cov, 10000).T
# 1、plt.hist2d:二维频次直方图
plt.hist2d(x, y, bins=30, cmap='Blues') # 看下图
# plt.hexbin:矩形划分 -> 六边形划分
# ax.hexbin(x, y, gridsize=30, cmap='Blues')
cb = plt.colorbar(label='count in bin')
# 2、平滑版本的二维频次直方图 - 核密度估计(kernel density estimation,KDE)
略
# 3、只计算数值结果不画图
counts, xedges, yedges = np.histogram2d(x, y, bins=30)
6、文字与注释
(1)文字
# 拿前面第一个线形图的做例子:
fig = plt.figure()
ax = plt.axes()
x = np.linspace(0, 10, 1000)
ax.plot(x, np.cos(x),color='blue',linestyle='dotted',label='cos(x)');
ax.plot(x, np.sin(x),color='0.9',label='sin(x)');
# ax.text() 在图上增加文字标签
style = dict(size=10, color='gray')
ax.text(1, 0.1, "111", ha='center',**style)
ax.text(5, 0.5, "222", ha='center', **style)
ax.text(10, 0.8, "333", ha='center', **style)
ax.text() 的 transform
有三种不同的坐标系:
# 1、transData 坐标用x 轴与y 轴的标签作为数据坐标。
ax.text(1, 1, ". Data: (1, 1)", transform=ax.transData)
# 2、transAxes 坐标以坐标轴(图中白色矩形)左下角的位置为原点,按坐标轴尺寸的比例呈现坐标。
ax.text(0.5, 0.1, ". Axes: (0.5, 0.1)", transform=ax.transAxes)
# 3、transFigure 坐标与之类似,不过是以图形(图中灰色矩形)左下角的位置为原点,按图形尺寸的比例呈现坐标。
ax.text(0.2, 0.2, ". Figure: (0.2, 0.2)", transform=fig.transFigure);
# 假如你改变了坐标轴上下限,那么只有transData 坐标会受影响,其他坐标系都不变!
(2)箭头
# 拿前面第一个线形图的做例子:
fig = plt.figure()
ax = plt.axes()
x = np.linspace(0, 10, 1000)
ax.plot(x, np.cos(x),color='blue',linestyle='dotted',label='cos(x)');
ax.plot(x, np.sin(x),color='0.9',label='sin(x)');
# ax.text() 在图上增加文字标签
ax.annotate('local maximum', xy=(1, 0.3), xytext=(3, 0.5), arrowprops=dict(facecolor='black', shrink=0.05))
7、三维图
# ax.plot3D - 三维线图
zline = np.linspace(0, 15, 1000)
xline = np.sin(zline)
yline = np.cos(zline)
ax.plot3D(xline, yline, zline, 'gray')
# ax.scatter3D - 三维散点图
zdata = 15 * np.random.random(100)
xdata = np.sin(zdata) + 0.1 * np.random.randn(100)
ydata = np.cos(zdata) + 0.1 * np.random.randn(100)
ax.scatter3D(xdata, ydata, zdata, c=zdata, cmap='Greens');
# 等高线、线框图、曲面图 区别
8、地图
需要用到第三方库:conda install basemap
略
9、更多功能
# 配置颜色条
# 略
# 多子图
# 略
# 自定义坐标轴刻度
# 略
https://matplotlib.org/gallery.html 可以看到更多的图形 demo 和配套代码
三、其他画图方法
1、Seaborn
第三方的 Seaborn 在 Matplotlib 的基础上开发了一套 API,为默认的图形样式和颜色设置提供了理智的选择,为常用的统计图形定义了许多简单的高级函数,并与 Pandas DataFrame 的功能有机结合。
略
2、pandas DataFrame 自带画图功能
df = pd.DataFrame({'lab':['A', 'B', 'C'], 'val':[10, 30, 20]})
print(df)
ax = df.plot.bar(x='lab', y='val', rot=0) # 赋值给 ax 是为了不让输出 df.plot.bar 这个冗余信息
参考资料
《Python 数据科学手册》
Matplotlib 使用 - 《Python 数据科学手册》学习笔记的更多相关文章
- 《Python数据科学手册》第五章机器学习的笔记
目录 <Python数据科学手册>第五章机器学习的笔记 0. 写在前面 1. 判定系数 2. 朴素贝叶斯 3. 自举重采样方法 4. 白化 5. 机器学习章节总结 <Python数据 ...
- 学习《Python数据科学手册》高清中文PDF+高清英文PDF+代码
如果有一定的数据分析与机器学习理论与实践基础,<Python数据科学手册>这本书是绝佳选择. 是对以数据深度需求为中心的科学.研究以及针对计算和统计方法的参考书.很友好实用,结构很清晰.但 ...
- Python数据科学手册
Python数据科学手册(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1KurSdjNWiwMac3o3iLrzBg 提取码:qogy 复制这段内容后打开百度网盘手 ...
- 《Python数据科学手册》
<Python数据科学手册>[美]Jake VanderPlas著 陶俊杰译 Absorb what is useful, discard what is not, and add wh ...
- Python数据科学手册-前言
读Python数据科学手册 笔记 系列 数据科学 data science https://img2022.cnblogs.com/blog/2827305/202205/2827305-202205 ...
- 100天搞定机器学习|day45-53 推荐一本豆瓣评分9.3的书:《Python数据科学手册》
<Python数据科学手册>共五章,每章介绍一到两个Python数据科学中的重点工具包.首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境:第2章讲解能提供nda ...
- Python数据科学手册Seaborn马拉松可视化里时分秒转化为秒数的问题
Python数据科学手册Seaborn马拉松可视化里时分秒转化为秒数的问题 问题描述: 我实在是太懒了,问题描述抄的网上的哈哈哈:https://www.jianshu.com/p/6ab7afa05 ...
- python书籍推荐:Python数据科学手册
所属网站分类: 资源下载 > python电子书 作者:today 链接:http://www.pythonheidong.com/blog/article/448/ 来源:python黑洞网 ...
- Python 数据科学手册:读书笔记概论
为防止遗忘,在空闲时间将读书的笔记开始按照章节进行概括总结(2022.1.1): 第二章:NumPy 入门 第三章:Pandas 数据处理 第四章:Matplotlib 数据可视化 第五章:机器学习 ...
随机推荐
- 分析easyswoole3.0源码,体验es3(三)
demo在手,总得去试试看效果吧.我们先把默认的服务改成webserver,并且添加数据库的配置. 建立数据库,github里面有相关内容 CREATE TABLE `user_list` ( `us ...
- Integer 比较忽略的问题
Integer i1 = 100; Integer i2 = 100; i1==i2Integer i3 = 199; Integer i4 = 200; i3+1 == i4int i5 = 200 ...
- linux下修改时间戳
Linux下touch是一个非常有用的命令. touch语法结构如下: touch [-acfm][-d <日期时间>][-r <参考文件或目录>][-t <日期时间&g ...
- 面试简单整理之zookeeper
157.zookeeper 是什么? ZooKeeper 是一个开源的分布式协调服务,由雅虎创建,是 Google Chubby 的开源实现. 分布式应用程序可以基于 ZooKeeper 实现诸如数据 ...
- day 8:open文件和with的使用
本节内容: 1,open打开文件后的几种操作 2,with和open的连用 3,flush的使用 1:open 1)r权限 f = open("D:\\auto\project\\fulls ...
- 20170529计划---统计业务量并生成EXCEL通过邮件发送
每个月都要统计这些业务量的东东,烦死了,赶紧通过python写一个来搞定吧,三天搞定吧,未完待续哈. 2017-5-29 19:50粗略地做了一个思维导图哈 终于第三天完成啦 #encoding=ut ...
- delphi中 panel如何在Form实现鼠标移动拖放
Panel的MouseDown事件 移动就写上ReleaseCapture;SendMessage(Panel1.Handle,wm_SysCommand,$F012,0); 改变大小就写上Relea ...
- target = e.target || e.srcElement(转载)
//鼠标点击出现下拉菜单,点其他地方,缩回去. document.addEventListener("mousedown", function(e) { var target = ...
- ssh 免密登录阿里云主机
在网上找了好几篇教程,都不好使. 终于在这篇找到了答案 解决方案: 在 sshd_config 里面将这一项: AuthorizedKeysFile .ssh/authorized_keys 被我修改 ...
- 使用ajax实现html页面产品详情页文字具体内容
<script type="text/javascript" src="Assets/js/jquery.min.js"></script&g ...