波士顿房价预测

首先这个问题非常好
其实要完整的回答这个问题很有难度，我也没有找到一个完整叙述这个东西的资料，所以下面主要是结合我自己的理解和一些资料谈一下r^2，mean square error 和 mean absolute error。可能不是很完整，供参考

MSE

这个应用应该是最广的，因为他能够求导，所以经常作为loss function。计算的结果就是你的预测值和真实值的差距的平方和。

MAE

这个用的不是上面的平方项了，而是用了绝对值项。

R^2

看公式其实不难发现，它和MSE是有相似的，关键在于下面除了一个东西。简单的想就是相当于对预测值和真实值的趋势做了一个对比。

SMSE

比较

首先从公式也能看出来，这三个基本上是R^2算一类，然后MSE和MAE算另一类。为什么呢？因为R^2相当于是对所有的数据都会有一个相同的比较标准。也就是说你得到一个值0.9999，那就非常好（当然对不同的应用你对好的定义可能会不一样，比如某些你觉得0.6就够了，某些你要0.8）。而MAE和MSE就是数据相关了，范围可以非常大，你单纯根据一个值完全不知道效果怎么样。

而MAE 和MSE的选择主要是取决于你的应用场景，因为MSE会对离平均较远的点给一个更大的惩罚值（有平方嘛），而MAE则是给一个相对更小的。这个你可以参考这个链接3。

This depends on your loss function. In many circumstances it makes sense to give more weight to points further away from the mean--that is, being off by 10 is more than twice as bad as being off by 5. In such cases RMSE is a more appropriate measure of error.

If being off by ten is just twice as bad as being off by 5, then MAE is more appropriate.

http://stats.stackexchange.com/questions/48267/mean-absolute-error-or-root-mean-squared-error

题目中为什么用了R^2

这个我也是猜猜（毕竟不是我出的嘛），因为如果用另两个的话，你得出一个结果6.66，那么你怎么说这个好还是不好？根本没法说嘛。那这个问题你就没法回答了。

PS：其实老版的project里面就有一个问题是说，让你为这个问题选择一个performance metric，其中最难分辨的就是MAE和MSE，你可以考虑下这个问题用哪个更好。

来源： http://blog.csdn.net/duxinyuhi/article/details/52233993

可决系数R^2和MSE，MAE，SMSE的更多相关文章

可决系数R^2和方差膨胀因子VIF
然而很多时候,被筛选的特征在模型上线的预测效果并不理想,究其原因可能是由于特征筛选的偏差. 但还有一个显著的因素,就是选取特征之间之间可能存在高度的多重共线性,导致模型对测试集预测能力不佳. 为了在筛 ...
MSE, MAE, Huber loss详解
转载:https://mp.weixin.qq.com/s/Xbi5iOh3xoBIK5kVmqbKYA https://baijiahao.baidu.com/s?id=16119517755261 ...
【笔记】衡量线性回归法的指标 MSE,RMS,MAE以及评价回归算法 R Square
衡量线性回归法的指标 MSE,RMS,MAE以及评价回归算法 R Square 衡量线性回归法的指标对于分类问题来说,我们将原始数据分成了训练数据集和测试数据集两部分,我们使用训练数据集得到模型以后 ...
回归分析|r^2|Se|变差|多重相关系数|决定系数|多重共线性|容忍度|VIF|forward selection|backward elimination|stepwise regression procedure|best-subset approach|回归方程的置信区间|预测区间|残差分析|虚拟变量
应用统计学-回归分析拟合度使用r^2和Se来检验. 显著性检验中,对于线性model使用ANOVA,对于单独的回归系数使用t检验. 最小二乘法.贝叶斯和最大似然都可用于求回归参数,最小二乘法是最小化 ...
利用Module模块把构建的神经网络跑起来
训练一个神经网络往往只需要简单的几步: 准备训练数据初始化模型的参数模型向往计算与向后计算更新模型参数设置相关的checkpoint 如果上述的每个步骤都需要我们写Python的代码去一步步实 ...
生成对抗网络（Generative Adversarial Networks，GAN）初探
1. 从纳什均衡(Nash equilibrium)说起我们先来看看纳什均衡的经济学定义: 所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处.换句话 ...
Python Sklearn.metrics 简介及应用示例
Python Sklearn.metrics 简介及应用示例利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个模块/库. 无论利用机器学习算法进行 ...
python线性回归
一.理论基础 1.回归公式对于单元的线性回归,我们有:f(x) = kx + b 的方程(k代表权重,b代表截距). 对于多元线性回归,我们有: 或者为了简化,干脆将b视为k0·x0,,其中k0为1 ...
SparkMLlib回归算法之决策树
SparkMLlib回归算法之决策树 (一),决策树概念 1,决策树算法(ID3,C4.5 ,CART)之间的比较: 1,ID3算法在选择根节点和各内部节点中的分支属性时,采用信息增益作为评价标准.信 ...

随机推荐

my docker note
环境: docker1.10.3 #hello docker docker run --name myhello docker.io/centos:67591570dd29 /bin/echo 'he ...
mysql数据库详解
001 数据库应用系统设计 1.规划 2.需求分析 3.概念模型设计 4.逻辑设计 5.物理设计 6.程序编制及调试 7.运行及维护. 002 创建数据库 CREATE DAT ...
Safari无痕模式下，storage被禁用问题
前言 Safari开启无痕模式后,localStorage和sessionStorage为空,对其进行set操作也会报错,也就是说这种情况下,storage是被禁止使用了.接下来说一下解决方法. 解决 ...
一个对inner jion ...on 的sql多表联合查询的练习
create database practiceSql; use practiceSql; -- create table student( `id` bigint not null auto_inc ...
优秀iOS文章集合
Runtime 10种用法(没有比这更全的了成为iOS顶尖高手,你必须来这里(这里有最好的开源项目和文章)iOS逆向Reveal查看任意app 的界面JSPatch (实时修复App Store bu ...
关于安卓开发的学习一：webview
在网上看到几篇不错的博客,分享和学习一下! Android使用WebView加载网页 https://blog.csdn.net/tuke_tuke/article/details/51684254 ...
任务九：使用HTML/CSS实现一个复杂页面
任务目的通过实现一个较为复杂的页面,加深对于HTML,CSS的实战能力实践代码的复用.优化任务描述通过HTML及CSS实现设计稿设计稿PSD文件(点击下载),效果如效果图(点击打开) 整个 ...
Hadoop自定义JobTracker和NameNode管理页面
为了可以方便地在hadoop的管理界面(namenode和jobtracker)中自定义展示项,使用代理servlet的方式实现了hadoop的管理界面. 首先, 在org.apache.hadoop ...
dubbo学习总结一 API
API 一般用来暴露接口项目分层一般是 api + entity + enums + model 就是接口加上一些实体之类的东西
java面试题之----Java内部类
这是我学习Java内部类的笔记 1.为什么使用内部类? 使用内部类最吸引人的原因是:每个内部类都能独立地继承一个(接口的)实现,所以无论外围类是否已经继承了某个(接口的)实现, 对于内部类都没有影响 ...

可决系数R^2和MSE，MAE，SMSE

MSE

MAE

R^2

比较

题目中为什么用了R^2

可决系数R^2和MSE，MAE，SMSE的更多相关文章

随机推荐

热门专题