Adaboost的python实现

不要总是掉包欧，真的丢人啊，一起码起来！

'''
函数的功能：单层决策树分类函数
参数说明：
        xMat：数据矩阵
        i：第i列，第几个特征
        Q：阈值
返回分类结果：
        re
'''
import numpy as np
import pandas as pd

def classify0(xMat,i,Q,S):
    re = np.ones((xMat.shape[0],1))
    if S == 'lt':
        re[xMat[:,i]<= Q] = -1
    else:
        re[xMat[:, i] >Q] = -1
    return re

'''
函数功能：找到数据集上最佳的单层决策树
xMat：特征矩阵
yMat：标签矩阵
D：样本权重
返回：
beststump：最佳单层决策树信息
minE：最小误差
bestClas：最佳的分类结果
'''
def get_Stump(xMat,yMat,D):
    m,n = xMat.shape   #m为样本数，n为特征数
    Steps = 10    #初始化一个步长
    bestStump = {}   #用字典的形式存储树桩信息
    bestClas = np.mat(np.zeros((m,1)))  #初始化分类结果为1
    minE = np.Inf
    for i in range(-1,n): #遍历所有特征
        Min = xMat[:,i].min()  #找到特征中最小的值
        Max = xMat[:,i].max()   #找到特征中最大的值
        stepSize = (Max-Min)/Steps   #计算步长
        for j in range(-1,int(Steps)+1):    #
            for S in ['lt','gt']:   #大于或者小于的情况下
                Q = (Min+j*stepSize)   #计算阈值
                re = classify0(xMat,i,Q,S)  #计算分类结果
                err = np.mat(np.ones((m,1)))
                err[re==yMat]=0   #分类正确的赋值为0
                eca = D.T*err   #计算误差
                if eca<minE:  #找到误差最小的分类方式
                    minE = eca
                    bestClas = re.copy()
                    bestStump['特征列']=i
                    bestStump['阈值'] = Q
                    bestStump['标志'] = S
        return bestStump,minE,bestClas
xMat = np.matrix([[1,2.1],[1.5,1.6],[1.3,1],[1,1],[2,1]])
yMat = np.matrix([[1],[1],[-1],[-1],[1]])
#print(yMat.shape)
m = xMat.shape[0]
D = np.mat(np.ones((m,1))/m)
bestStump,minE,bestClas = get_Stump(xMat,yMat,D)
#print(bestStump)
#print(minE)
#print(bestClas)
'''
函数功能：
maxC为最大迭代次数
weakClass弱分类信息
aggClass类别估计值
'''
def adaboost(xMat,yMat,maxC=4):
    weakClass = []
    m = xMat.shape[0]
    D = np.mat(np.ones((m,1))/m)   #初始化权重
    aggClass = np.mat(np.zeros((m,1)))
    for i in range(maxC):
        Stump,error,bestClas = get_Stump(xMat,yMat,D)  #构建单层分类器
        alpha = float(0.5*np.log((1-error)/max(error,1e-6)))  #计算弱分类器的权重衰减  max(error,1e-6)让坟墓不等于0
        Stump['alpha'] = np.round(alpha,2)  #存储弱学习算法的权重，保留两位小数
        weakClass.append(Stump)    #存储单层决策树
        expon = np.multiply(-1*alpha*yMat,bestClas)
        D = np.multiply(D,np.exp(expon))
        D = D/D.sum()      #更新样本权重
        aggClass+= alpha+bestClas   #更新累计类别的统计值
        aggErr = np.multiply(np.sign(aggClass)!=yMat,np.ones((m,1)))
        errRate = aggErr.sum()/m
        if errRate==0:break   #误差为0 推出循环
    return weakClass,aggClass

weakClass,aggClass = adaboost(xMat,yMat,maxC=4)
print(weakClass)
print(aggClass)

Adaboost的python实现的更多相关文章

Adaboost 算法实例解析
Adaboost 算法实例解析 1 Adaboost的原理 1.1 Adaboost基本介绍 AdaBoost,是英文"Adaptive Boosting"(自适应增强)的缩写,由 ...
【Supervised Learning】集成学习Ensemble Learning & Boosting 算法（python实现）
零. Introduction 1.learn over a subset of data choose the subset uniformally randomly (均匀随机地选择子集) app ...
【机器学习Machine Learning】资料大全
昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machi ...
机器学习(Machine Learning)&深度学习(Deep Learning)资料【转】
转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...
机器学习&深度学习经典资料汇总,data.gov.uk大量公开数据
<Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.D ...
近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等）(1)
原文:http://developer.51cto.com/art/201501/464174.htm 编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等.而且原文也会不定 ...
机器学习(Machine Learning)&深度学习(Deep Learning)资料汇总（上）
转载:http://dataunion.org/8463.html?utm_source=tuicool&utm_medium=referral <Brief History of Ma ...
近200篇机器学习&深度学习资料分享【转载】
编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等.而且原文也会不定期的更新,望看到文章的朋友能够学到更多. <Brief History of Machine Le ...
机器学习&深度学习资料分享
感谢:https://github.com/ty4z2008/Qix/blob/master/dl.md <Brief History of Machine Learning> 介绍:这是 ...

随机推荐

Vue-cli3与springboot项目整合打包
一.需求使用前后端分离编写了个小程序,前端使用的是vue-cli3创建的项目,后端使用的是springboot创建的项目,部署的时候一起打包部署,本文对一些细节部分进行了说明. 二 ...
JS操作小记
this.Phenomenon.forEach(element => { if (element.value3 == this.prvphe) { this.Reason1 = element. ...
Jmeter测试入门——带token的http请求
安装官网下载地址:http://jmeter.apache.org/download_jmeter.cgi 下载完成后解压zip包启动JMeter,双击JMeter解压路径bin下面的jmeter ...
grep -o -E
sed 命令可以很好的进行行匹配,但从某一行中精确匹配某些内容,则使用 grep 命令并辅以 -o 和 -E 选项可达到此目的.其中 -o 表示“only-matching”,即“仅匹配”之意.光用它 ...
upper_bound()和low_bound函数的基本使用和理解(转载，已获博主授权)
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/sdz20172133/article/details/80101838 前提:一个非降序列!!!!! ...
Spring Boot-运行部署
Main方法直接运行启动类main方法遵循应用程序入口点的Java约定的标准方法.我们的main方法SpringApplication通过调用委托给Spring Boot的类run. Spring ...
.net core文件系统简介
在asp.net core程序中,我们可以通过如下代码开启对Web 根目录内的文件静态访问功能: app.UseStaticFiles(); 如果要提供更高级的选项,例如:将其它的物理文件夹下的文件作 ...
UVA - 1451 Average （斜率优化）
题意:由01组成的长度为n的子串,AT由0表示,GC由1表示,求一段长度大于等于L且GC率最高的子串的起始终止坐标,若GC率相同,取长度较小,若长度相同,取起始坐标最小. 分析: 1.一个子串(i+1 ...
超低功耗2.4G收发一体： SI24R1
Si24R1是一颗工作在2.4GHz ISM频段,专为低功耗无线场合设计,集成嵌入式ARQ基带协议引擎的无线收发器芯片.工作频率范围为2400MHz-2525MHz,共有126个1MHz带宽的信道.同 ...
python+opencv+dlib瘦脸效果
对实现人脸瘦脸简单功能的一个记录,大概流程如下: 1.使用dlib检测出人脸关键点 2.使用Interactive Image Warping 局部平移算法实现瘦脸参考:https://blog.c ...

Adaboost的python实现

Adaboost的python实现的更多相关文章

随机推荐

热门专题