根据已给的波士顿房价数据,对波斯顿房价进行预测.即,实现给出若干条件(如房间数.社区的低收入阶层的比率和镇上学生与教师数量比例的部分数据),要能说出给出的条件是否能够有效进行预测,如可以做有效预测,则给出预测的结果.上面的是数据下面是ID3的算法 #coding:utf-8 __author__ = 'liukai' from math import log class DecisonTree: trainData = [] trainLabel = [] featureValus = {} #…
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习专题的第21篇文章,我们一起来看一个新的模型--决策树. 决策树的定义 决策树是我本人非常喜欢的机器学习模型,非常直观容易理解,并且和数据结构的结合很紧密.我们学习的门槛也很低,相比于那些动辄一堆公式的模型来说,实在是简单得多. 其实我们生活当中经常在用决策树,只是我们自己没有发现.决策树的本质就是一堆if-else的组合,举个经典的例子,比如我们去小摊子上买西瓜.水果摊的小贩都是怎么做的?拿起西瓜翻滚一圈,看一眼,然后伸…
1. 1.问题的引入 2.一个实例 3.基本概念 4.ID3 5.C4.5 6.CART 7.随机森林 2. 我们应该设计什么的算法,使得计算机对贷款申请人员的申请信息自动进行分类,以决定能否贷款? 一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话: 女儿:多大年纪了? 母亲:26. 女儿:长的帅不帅? 母亲:挺帅的. 女儿:收入高不? 母亲:不算很高,中等情况. 女儿:是公务员不? 母亲:是,在税务局上班呢. 女儿:那好,我去见见. 决策过程: 这个女孩的决策过程就是典型的分类树决策.…
决策树笔记:使用ID3算法 决策树笔记:使用ID3算法 机器学习 先说一个偶然的想法:同样的一堆节点构成的二叉树,平衡树和非平衡树的区别,可以认为是"是否按照重要度逐渐降低"的顺序来分叉的. 其实这个也不一定局限于平衡树的解释.huffman编码就是这么干的:出现频率最高的编码一定是与root直接相连的,是层数最浅的. 什么是决策树 简单讲就是一棵多叉树,每个节点表示一个决策,它的不同分支表示依据决策结果划分的子类:子树要么仍然是决策数,要么是叶节点.叶节点表示原有label或某一个维…
Contents      1. 决策树的基本认识      2. ID3算法介绍      3. 信息熵与信息增益      4. ID3算法的C++实现 1. 决策树的基本认识    决策树是一种依托决策而建立起来的一种树.在机器学习中,决策树是一种预测模型,代表的是一种对 象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能 的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值.决策树仅 有单一输出,如果有多个输出,可以分别…
决策树之ID3算法 Content 1.ID3概念 2.信息熵 3.信息增益 Information Gain 4. ID3 bias 5. Python算法实现(待定) 一.ID3概念 ID3算法最早是由罗斯昆(J. Ross Quinlan)于1975年在悉尼大学提出的一种分类预测算法,算法的核心是"信息熵".ID3算法通过计算每个属性的信息增益,认为信息增益高的是好属性,每次划分选取信息增益最高的属性为划分标准,重复这个过程,直至生成一个能完美分类训练样例的决策树. 决策树是对数…
本文申明:本文原创,如有转载请申明.数据代码来自实验数据都是来自[美]Peter Harrington 写的<Machine Learning in Action>这本书,侵删. Hello,又和大家见面了,今天心情出奇的好,不知道为什么.就是好...此处省略一万字...上一次和大家说了,决策树的理论部分,今天我们就来动手帮助眼科医生做一个系统,让这个系统学会给需要隐形眼睛的用户一个建议,让用户可以知道自己适合哪种眼睛.老规矩,系统先从数据中学习. 一:计算给定数据集的香浓熵 大家还记得我们上…
# coding:utf-8 import matplotlib.pyplot as plt import numpy as np import pylab def createDataSet(): #贷款申请样本数据表 dataset = [["青年", "否", "否", "一般", "拒绝"], ["青年", "否", "否", "…
基于自适应算法的PLC滴灌控制系统 陕西中际现代包装科技有限公司滴灌部 1.介绍 水资源正在成为一种珍贵的资源.城镇的市民使用成千上万立方的水来浇灌花园和绿地.他们依赖于使用固定灌溉计划的控制器.而这些控制器通常被编程为满足最大用水量,最终在凉爽的或阴天的日子里浪费了大量的水.农民的滴灌和喷灌系统也使用固定的灌溉控制器,因此在凉爽的日子里也浪费了大量的水,而且在生长季节开始,庄稼对水的需求是最小的. 本工作目的是开发开发自动的灌溉系统,使用单一的气候标准调整作物所需要的灌水深度.标准如:气温,总…
自己用Python写的数据挖掘中的ID3算法,现在觉得Python是实现算法的最好工具: 先贴出ID3算法的介绍地址http://wenku.baidu.com/view/cddddaed0975f46527d3e14f.html 自己写的ID3算法 from __future__ import division import math table = {'age': {'young', 'middle', 'old'}, 'income': {'high', 'middle', 'low'},…