1. #coding:utf-8
  2.  
  3. # from python.Lib.packages.sklearn.tree import DecisionTreeClassifier
  4. # from python.Lib.packages.matplotlib.pyplot import *
  5. # from python.Lib.packages.sklearn.cross_validation import train_test_split
  6. # from python.Lib.packages.sklearn.ensemble import RandomForestClassifier
  7. # from python.Lib.packages.sklearn.externals.joblib import Parallel,delayed
  8. # from python.Lib.packages.sklearn.tree import export_graphviz
  9. # from python.Lib.packages.sklearn.datasets import load_iris
  10. # import python.Lib.packages.pandas as pd
  11.  
  12. from sklearn.tree import DecisionTreeClassifier
  13. from matplotlib.pyplot import *
  14. from sklearn.cross_validation import train_test_split
  15. from sklearn.ensemble import RandomForestClassifier
  16. from sklearn.externals.joblib import Parallel,delayed
  17. from sklearn.tree import export_graphviz
  18. from sklearn.datasets import load_iris
  19. import pandas as pd
  20.  
  21. def RandomForest(dir):
  22. # final = open('F:/test/final.dat' , 'r')
  23. data=pd.read_csv(dir)
  24. # data = [line.strip().split('\t') for line in final]
  25. feature=data[[i for i in range(8)]].values
  26. target=data[[8]].values
  27. # target1=[target[0][i] for i in range(len(target[0]))]
  28. # print feature
  29. # print target
  30. # feature = [[float(x) for x in row[3:]] for row in data]
  31. # target = [int(row[0]) for row in data]
  32.  
  33. #拆分训练集和测试集
  34. # iris=load_iris()
  35. #
  36. # feature=iris.data
  37. # target=iris.target
  38. # print iris['target'].shape
  39. feature_train, feature_test, target_train, target_test = train_test_split(feature, target, test_size=0.1, random_state=42)
  40.  
  41. #分类型决策树
  42. clf = RandomForestClassifier()
  43.  
  44. #训练模型
  45. s = clf.fit(feature_train,target_train)
  46. print s
  47.  
  48. #评估模型准确率
  49. r = clf.score(feature_test , target_test)
  50. print r
  51.  
  52. print u'判定结果:%s' % clf.predict(feature_test[0])
  53. #print clf.predict_proba(feature_test[0])
  54.  
  55. print u'所有的树:%s' % clf.estimators_
  56.  
  57. print clf.classes_
  58. print clf.n_classes_
  59.  
  60. print u'各feature的重要性:%s' % clf.feature_importances_
  61. if __name__=="__main__":
  62. dir="Carseats.csv"
  63. RandomForest(dir)

Python随机森林算法的使用的更多相关文章

  1. H2O中的随机森林算法介绍及其项目实战(python实现)

    H2O中的随机森林算法介绍及其项目实战(python实现) 包的引入:from h2o.estimators.random_forest import H2ORandomForestEstimator ...

  2. 用Python实现随机森林算法,深度学习

    用Python实现随机森林算法,深度学习 拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱.bagging(bootstrap aggregating 的缩 ...

  3. Python机器学习笔记——随机森林算法

    随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为“代 ...

  4. 随机森林算法demo python spark

    关键参数 最重要的,常常需要调试以提高算法效果的有两个参数:numTrees,maxDepth. numTrees(决策树的个数):增加决策树的个数会降低预测结果的方差,这样在测试时会有更高的accu ...

  5. 随机森林算法OOB_SCORE最佳特征选择

    RandomForest算法(有监督学习),可以根据输入数据,选择最佳特征组合,减少特征冗余:原理:由于随机决策树生成过程采用的Boostrap,所以在一棵树的生成过程并不会使用所有的样本,未使用的样 ...

  6. Spark mllib 随机森林算法的简单应用(附代码)

    此前用自己实现的随机森林算法,应用在titanic生还者预测的数据集上.事实上,有很多开源的算法包供我们使用.无论是本地的机器学习算法包sklearn 还是分布式的spark mllib,都是非常不错 ...

  7. Bagging与随机森林算法原理小结

    在集成学习原理小结中,我们讲到了集成学习有两个流派,一个是boosting派系,它的特点是各个弱学习器之间有依赖关系.另一种是bagging流派,它的特点是各个弱学习器之间没有依赖关系,可以并行拟合. ...

  8. R语言︱决策树族——随机森林算法

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:有一篇<有监督学习选择深度学习 ...

  9. R语言︱机器学习模型评估方案(以随机森林算法为例)

    笔者寄语:本文中大多内容来自<数据挖掘之道>,本文为读书笔记.在刚刚接触机器学习的时候,觉得在监督学习之后,做一个混淆矩阵就已经足够,但是完整的机器学习解决方案并不会如此草率.需要完整的评 ...

随机推荐

  1. python requests库入门[转]

    首先,确认一下: Requests 已安装 Requests是 最新的 让我们从一些简单的示例开始吧. 发送请求 使用Requests发送网络请求非常简单. 一开始要导入Requests模块: > ...

  2. Uncaught TypeError: _react2.default.findDOMNode is not a function

    react 查找某节点时报错 Uncaught TypeError: _react2.default.findDOMNode is not a function 代码: import React, { ...

  3. Windows下RCNN的使用

    RCNN 一种把目标图像分割转化为CNN分类问题进行目标检测的方法. 以下转自魏晋的知乎回答   Ross B. Girshick的RCNN使用region proposal(具体用的是Selecti ...

  4. Cookie初识篇

    一.什么是Cookie Cookie,有时也用其复数形式Cookies,指某些网站为了辨别用户身份.进行session跟踪而储存在用户本地终端上的数据(通常经过加密).定义于RFC2109和2965都 ...

  5. node环境配置安装(nvm)

    在我们前端开发工程中,很多繁琐机械的操作都是会慢慢的被抽离出来的,当我们为dom操作和浏览器兼容性感到厌烦时,jQuery出现了,当我们不想再去理会dom的添加删除等的时候,angularJS来解救我 ...

  6. 转载:使用命令行启动VirtualBox虚拟机

    使用命令行启动VirtualBox虚拟机 装上VirtualBox就琢磨着如何让它开机自动启动,又或者能够通过命令行的形式直接启动指定的虚拟机. 看了下VirtualBox的官方文档,发现有一个命令可 ...

  7. springfox.documentation.spi.DocumentationType配置示例

    Java Code Examples for springfox.documentation.spi.DocumentationType The following are top voted exa ...

  8. 黄聪: Bootstrap之Form表单验证神器: BootstrapValidator(转)

    前言:做Web开发的我们,表单验证是再常见不过的需求了.友好的错误提示能增加用户体验.博主搜索bootstrap表单验证,搜到的结果大部分都是文中的主题:bootstrapvalidator.今天就来 ...

  9. youtube不显示其他人头像

    我用的是ss , 右键ss选择pac->编辑本地pac 把ggpht.com加入pac列表即可

  10. JavaScript 在不刷新或跳转页面的情况下改变当前浏览器地址栏上的网址

    JavaScript 在不刷新或跳转页面的情况下改变当前浏览器地址栏上的网址 var stateObject = {}; var title = "改变后的网址的标题"; var ...