在scikit-learn中，回归模型的可视化评估是一个重要环节。
它帮助我们理解模型的性能，分析模型的预测能力，以及检查模型是否存在潜在的问题。
通过可视化评估，我们可以更直观地了解回归模型的效果，而不仅仅依赖于传统的评估指标。

1. 残差图

所谓残差，就是实际观测值与预测值之间的差值。

残差图是指以残差为纵坐标，以任何其他指定的量为横坐标的散点图。
如果残差图中描绘的点围绕残差等于0的直线上下随机散布，说明回归直线对原观测值的拟合情况良好。反之，则说明回归直线对原观测值的拟合不理想。

下面做一个简单的线性回归模型，然后绘制残差图。

from sklearn.datasets import make_regression

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

from sklearn.metrics import PredictionErrorDisplay

fig, ax = plt.subplots(1, 2)

fig.set_size_inches(10, 4)

X, y = make_regression(n_samples=100, n_features=1, noise=10)

ax[0].scatter(X[:, 0], y, marker="o")

ax[0].set_title("样本数据")

# 初始化最小二乘法线性模型

reg = LinearRegression()

# 训练模型

reg.fit(X, y)

y_pred = reg.predict(X)

ax[0].plot(X, y_pred, color="red")

display = PredictionErrorDisplay(y_true=y, y_pred=y_pred)

ax[1].set_title("残差图")

display.plot(ax=ax[1])

plt.show()

左边是随机生成的样本数据，其中的红线是训练之后拟合的线性模型。
右边是根据scikit-learn中提供的PredictionErrorDisplay模块生成的残差图。

2. 对比图

对比图将实际目标值与模型预测值进行对比，直观地展示模型的预测能力。
通常，我们希望看到实际值与预测值沿着一条\(y=x\)的直线分布，这意味着模型预测非常准确。

下面用一些混乱度高的样本，来看看对比图的效果。

from sklearn.datasets import make_regression

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

from sklearn.metrics import PredictionErrorDisplay

fig, ax = plt.subplots(1, 2)

fig.set_size_inches(12, 6)

# 混乱度高，noise=100

X, y = make_regression(n_samples=100, n_features=1, noise=100)

ax[0].scatter(X[:, 0], y, marker="o")

ax[0].set_title("样本数据")

# 初始化最小二乘法线性模型

reg = LinearRegression()

# 训练模型

reg.fit(X, y)

y_pred = reg.predict(X)

ax[0].plot(X, y_pred, color="red")

display = PredictionErrorDisplay(y_true=y, y_pred=y_pred)

ax[1].set_title("对比图")

display.plot(ax=ax[1], kind="actual_vs_predicted")

plt.show()

原始样本比较混乱，线性模型很难拟合，所以看对比图就可以发现，真实值和预测值差别很大。
越靠近对比图中间那个虚线的点，真实值和预测值越接近。

换一个混乱程度低的样本，再看看对比图的效果。

# 混乱度 noise=10，比如上面那个示例降10倍

# 上面代码只改这一行，其它部分代码不用改

X, y = make_regression(n_samples=100, n_features=1, noise=10)

从图中也可以看出，这次的模型拟合效果要好很多。

3. 总结

可视化的图形向我们传达了模型预测的准确性、线性假设的满足程度、误差项的独立性以及特征对预测的影响程度等信息，让我们对模型有更深入的了解。

通过图形化的方式，帮助我们更直观地理解回归模型的性能，发现模型潜在的问题，指导我们改进模型。
不过，可视化评估虽然直观，但并不能完全替代传统的量化评估指标。
两者应该相互补充，共同构成对回归模型性能的全面评价。

【scikit-learn基础】--『回归模型评估』之可视化评估的更多相关文章

(原创)（四）机器学习笔记之Scikit Learn的Logistic回归初探
目录 5.3 使用LogisticRegressionCV进行正则化的 Logistic Regression 参数调优一.Scikit Learn中有关logistics回归函数的介绍 1. 交叉 ...
(原创)（三）机器学习笔记之Scikit Learn的线性回归模型初探
一.Scikit Learn中使用estimator三部曲 1. 构造estimator 2. 训练模型:fit 3. 利用模型进行预测:predict 二.模型评价模型训练好后,度量模型拟合效果的 ...
逻辑回归模型(Logistic Regression, LR)基础
逻辑回归模型(Logistic Regression, LR)基础逻辑回归(Logistic Regression, LR)模型其实仅在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函 ...
『高性能模型』轻量级网络ShuffleNet_v1及v2
项目实现:GitHub 参考博客:CNN模型之ShuffleNet v1论文:ShuffleNet: An Extremely Efficient Convolutional Neural Netwo ...
回归模型效果评估系列1-QQ图
(erbqi)导语 QQ图全称 Quantile-Quantile图,也就是分位数-分位数图,简单理解就是把两个分布相同分位数的值,构成点(x,y)绘图:如果两个分布很接近,那个点(x,y)会分布在y ...
『高性能模型』HetConv: HeterogeneousKernel-BasedConvolutionsforDeepCNNs
论文地址:HetConv 一.现有网络加速技术 1.卷积加速技术作者对已有的新型卷积划分如下:标准卷积.Depthwise 卷积.Pointwise 卷积.群卷积(相关介绍见『高性能模型』深度可分离 ...
『高性能模型』轻量级网络MobileNet_v2
论文地址:MobileNetV2: Inverted Residuals and Linear Bottlenecks 前文链接:『高性能模型』深度可分离卷积和MobileNet_v1 一.Mobil ...
20165308『网络对抗技术』Exp5 MSF基础应用
20165308『网络对抗技术』Exp5 MSF基础应用一.原理与实践说明实践内容本实践目标是掌握metasploit的基本应用方式,重点常用的三种攻击方式的思路.具体需要完成: 一个主动攻击实 ...
2017-2018-2 20155303『网络对抗技术』Exp9：Web安全基础
2017-2018-2 『网络对抗技术』Exp9:Web安全基础 --------CONTENTS-------- 一.基础问题回答 1.SQL注入攻击原理,如何防御? 2.XSS攻击的原理,如何防御 ...
2017-2018-2 20155303『网络对抗技术』Exp8：Web基础
2017-2018-2 『网络对抗技术』Exp8:Web基础 --------CONTENTS-------- 一.原理与实践说明 1.实践具体要求 2.基础问题回答二.实践过程记录 1.Web前端 ...

随机推荐

开放 LLM 排行榜: 深入研究 DROP
最近,开放 LLM 排行榜迎来了 3 个新成员: Winogrande.GSM8k 以及 DROP,它们都使用了 EleutherAI Harness 的原始实现.一眼望去,我们就会发现 DROP ...
Apollo系列之架构设计（一）
原创文章,转载请标注.https:https://www.cnblogs.com/boycelee/p/17967590 目录一.什么是配置中心? 二.传统配置有什么问题? 三.配置中心的场景四. ...
正确理解c# default关键字
背景最近QA测试一个我开发的一个Web API时,我意识到之前对C#的default的理解一直是想当然的.具体情况是这样,这个API在某些条件下要返回模型的默认值,写法类似于下面这样 [HttpGe ...
ZK--简介，部署
官网:https://zookeeper.apache.org/ 本文zk版本:3.7.0 一.简介 ZooKeeper 是一个高可用的分布式数据管理与系统协调软件,它可以为分布式应用提供状态同步.配 ...
BP 供应商创建与修改
1业务场景 BP中,供应商和客户的创建发生了很大变化,之前的BAPI无法使用,本文档采用新的方法创建供应商. 2创建 2.1业务伙伴 2.2添加BP角色 2.3维护银行数据 2.4维护类别税号数据 2 ...
活动回顾｜阿里云 Serverless 技术实践营 Serverless +AI 专场
8月25日"阿里云Serverless技术实践营( Serverless + AI 专场)"北京站圆满落幕.活动受众以关注 Serverless +AI 技术的开发者.企业决策人. ...
极速生成缩略图，Serverless 支撑赛事转播锁定冬奥亮点
作者 | 西流.筱姜 "北京冬奥会在开赛的第四天便成为了历史上收视最高的一届冬奥会,其转播内容总生产量将达 6000 小时,超过平昌冬奥会的 5400 小时.关注北京冬奥会的人群比往届都 ...
vue 状态管理四、Action用法
系列导航 vue 状态管理一.状态管理概念和基本结构 vue 状态管理二.状态管理的基本使用 vue 状态管理三.Mutations和Getters用法 vue 状态管理四.Action用法 ...
十一、docker的容器互联
系列导航一.docker入门(概念) 二.docker的安装和镜像管理三.docker容器的常用命令四.容器的网络访问五.容器端口转发六.docker数据卷七.手动制作docker镜像八 ...
WebGPU光追引擎基础课系列目录
大家好~我开设了"WebGPU光追引擎基础课"的线上课程,从0开始,在课上带领大家现场写代码,使用WebGPU开发基础的光线追踪引擎课程重点在于基于GPU并行计算,实现BVH构建 ...

【scikit-learn基础】--『回归模型评估』之可视化评估

1. 残差图

2. 对比图

3. 总结

【scikit-learn基础】--『回归模型评估』之可视化评估的更多相关文章

随机推荐

热门专题