机器学习之路：python 集成回归模型随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归预测波士顿房价

python3 学习机器学习api

使用了三种集成回归模型

git: https://github.com/linyi0604/MachineLearning

代码：

 from sklearn.datasets import load_boston

 from sklearn.cross_validation import train_test_split

 from sklearn.preprocessing import StandardScaler

 from sklearn.ensemble import RandomForestRegressor, ExtraTreesRegressor, GradientBoostingRegressor

 from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error

 import numpy as np

 '''

 随机森林回归

 极端随机森林回归

 梯度提升回归

 通常集成模型能够取得非常好的表现

 '''

 # 1 准备数据

 # 读取波士顿地区房价信息

 boston = load_boston()

 # 查看数据描述

 # print(boston.DESCR)   # 共506条波士顿地区房价信息，每条13项数值特征描述和目标房价

 # 查看数据的差异情况

 # print("最大房价：", np.max(boston.target))   # 50

 # print("最小房价：",np.min(boston.target))    # 5

 # print("平均房价：", np.mean(boston.target))   # 22.532806324110677

 x = boston.data

 y = boston.target

 # 2 分割训练数据和测试数据

 # 随机采样25%作为测试 75%作为训练

 x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.25, random_state=33)

 # 3 训练数据和测试数据进行标准化处理

 ss_x = StandardScaler()

 x_train = ss_x.fit_transform(x_train)

 x_test = ss_x.transform(x_test)

 ss_y = StandardScaler()

 y_train = ss_y.fit_transform(y_train.reshape(-1, 1))

 y_test = ss_y.transform(y_test.reshape(-1, 1))

 # 4 三种集成回归模型进行训练和预测

 # 随机森林回归

 rfr = RandomForestRegressor()

 # 训练

 rfr.fit(x_train, y_train)

 # 预测 保存预测结果

 rfr_y_predict = rfr.predict(x_test)

 # 极端随机森林回归

 etr = ExtraTreesRegressor()

 # 训练

 etr.fit(x_train, y_train)

 # 预测 保存预测结果

 etr_y_predict = rfr.predict(x_test)

 # 梯度提升回归

 gbr = GradientBoostingRegressor()

 # 训练

 gbr.fit(x_train, y_train)

 # 预测 保存预测结果

 gbr_y_predict = rfr.predict(x_test)

 # 5 模型评估

 # 随机森林回归模型评估

 print("随机森林回归的默认评估值为：", rfr.score(x_test, y_test))

 print("随机森林回归的R_squared值为：", r2_score(y_test, rfr_y_predict))

 print("随机森林回归的均方误差为:", mean_squared_error(ss_y.inverse_transform(y_test),

                                           ss_y.inverse_transform(rfr_y_predict)))

 print("随机森林回归的平均绝对误差为:", mean_absolute_error(ss_y.inverse_transform(y_test),

                                              ss_y.inverse_transform(rfr_y_predict)))

 # 极端随机森林回归模型评估

 print("极端随机森林回归的默认评估值为：", etr.score(x_test, y_test))

 print("极端随机森林回归的R_squared值为：", r2_score(y_test, gbr_y_predict))

 print("极端随机森林回归的均方误差为:", mean_squared_error(ss_y.inverse_transform(y_test),

                                             ss_y.inverse_transform(gbr_y_predict)))

 print("极端随机森林回归的平均绝对误差为:", mean_absolute_error(ss_y.inverse_transform(y_test),

                                                ss_y.inverse_transform(gbr_y_predict)))

 # 梯度提升回归模型评估

 print("梯度提升回归回归的默认评估值为：", gbr.score(x_test, y_test))

 print("梯度提升回归回归的R_squared值为：", r2_score(y_test, etr_y_predict))

 print("梯度提升回归回归的均方误差为:", mean_squared_error(ss_y.inverse_transform(y_test),

                                             ss_y.inverse_transform(etr_y_predict)))

 print("梯度提升回归回归的平均绝对误差为:", mean_absolute_error(ss_y.inverse_transform(y_test),

                                                ss_y.inverse_transform(etr_y_predict)))

 '''

 随机森林回归的默认评估值为： 0.8391590262557747

 随机森林回归的R_squared值为： 0.8391590262557747

 随机森林回归的均方误差为: 12.471817322834646

 随机森林回归的平均绝对误差为: 2.4255118110236227

 极端随机森林回归的默认评估值为： 0.783339502805047

 极端随机森林回归的R_squared值为： 0.8391590262557747

 极端随机森林回归的均方误差为: 12.471817322834646

 极端随机森林回归的平均绝对误差为: 2.4255118110236227

 GradientBoostingRegressor回归的默认评估值为： 0.8431187344932869

 GradientBoostingRegressor回归的R_squared值为： 0.8391590262557747

 GradientBoostingRegressor回归的均方误差为: 12.471817322834646

 GradientBoostingRegressor回归的平均绝对误差为: 2.4255118110236227

 '''

机器学习之路：python 集成回归模型随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归预测波士顿房价的更多相关文章

机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价
python3学习使用api 线性回归,和随机参数回归 git: https://github.com/linyi0604/MachineLearning from sklearn.datasets ...
机器学习之路：python k近邻回归预测波士顿房价
python3 学习机器学习api 使用两种k近邻回归模型分别是平均k近邻回归和距离加权k近邻回归进行预测 git: https://github.com/linyi0604/Machine ...
机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价
python3 学习api的使用 git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.datasets import ...
机器学习之路: python k近邻分类器 KNeighborsClassifier 鸢尾花分类预测
使用python语言学习k近邻分类器的api 欢迎来到我的git查看源代码: https://github.com/linyi0604/MachineLearning from sklearn.da ...
机器学习之路: python 决策树分类DecisionTreeClassifier 预测泰坦尼克号乘客是否幸存
使用python3 学习了决策树分类器的api 涉及到特征的提取,数据类型保留,分类类型抽取出来新的类型需要网上下载数据集,我把他们下载到了本地, 可以到我的git下载代码和数据集: https: ...
机器学习之路--Python
常用数据结构 1.list 列表有序集合 classmates = ['Michael', 'Bob', 'Tracy'] len(classmates) classmates[0] len(cla ...
吴裕雄 python 机器学习——集成学习AdaBoost算法回归模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets,ensemble from sklear ...
Poisson回归模型
Poisson回归模型也是用来分析列联表和分类数据的一种方法,它实际上也是对数线性模型的一种,不同点是对数线性模型假定频数分布为多项式分布,而泊松回归模型假定频数分布为泊松分布. 首先我们来认识一下泊 ...
吴裕雄 python 机器学习——集成学习随机森林RandomForestRegressor回归模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets,ensemble from sklear ...

随机推荐

Linux基础-awk、变量、运算符、if
awk 程序的运行就是一些列状态的变量->用变量值的变化去表示以字母或下划线开头,剩下的部分可以是:字母.数字.下划线. 最好遵循下述规范: 1.以字母开头2.使用中划线或者下划线做单词的连接 ...
Activity相关知识点总结
一.Activity状态 Activity有三种状态:active/running.paused.stopped. 1.active/running状态,在当前屏幕时,即用户可见的Activity,位 ...
新浪的wap网站，发现原来我们的head存在着这样的差异
前一段时间一直被wap网站的自适应困惑…… 仔细研究了一下新浪的wap网站,发现原来我们的head存在着这样的差异…… <%@page contentType="text/html;c ...
trace spring
package xx.com.aspect; import org.aspectj.lang.ProceedingJoinPoint; import org.aspectj.lang.annotati ...
【Android开发日记】之入门篇（六）——Android四大组件之Broadcast Receiver
广播接受者是作为系统的监听者存在着的,它可以监听系统或系统中其他应用发生的事件来做出响应.如设备开机时,应用要检查数据的变化状况,此时就可以通过广播来把消息通知给用户.又如网络状态改变时,电量变化时都 ...
innosetup语法详解
; 脚本由 Inno Setup 脚本向导生成! ; 有关创建 Inno Setup 脚本文件的详细资料请查阅帮助文档! ;Inno Setup 是一个免费的 Windows 安装程序制作软件. ; ...
标准C++中的String类的使用
要使用标准C++中的String类,必须包含#include<string>(注意不是<string.h>带.h的是C语言中的头文件) 作者:耑新新,发布于博客园转载请注 ...
CCF CSP 201709-3 JSON查询
CCF计算机职业资格认证考试题解系列文章为meelo原创,请务必以链接形式注明本文地址 CCF CSP 201709-3 JSON查询问题描述 JSON (JavaScript Object Not ...
Hive（三）Hive元数据信息对应MySQL数据库表
概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...
【58沈剑架构系列】微服务架构之RPC-client序列化细节
第一章聊了[“为什么要进行服务化,服务化究竟解决什么问题”] 第二章聊了[“微服务的服务粒度选型”] 上一篇聊了[“为什么说要搞定微服务架构,先搞定RPC框架?”] 通过上篇文章的介绍,知道了要实施微 ...

机器学习之路：python 集成回归模型 随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归 预测波士顿房价

机器学习之路：python 集成回归模型 随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归 预测波士顿房价的更多相关文章

随机推荐

热门专题

机器学习之路：python 集成回归模型随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归预测波士顿房价

机器学习之路：python 集成回归模型随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归预测波士顿房价的更多相关文章