SMO启发式选择

%%

%   svm 简单算法设计 --启发式选择

%%

clc

clear

close all

% step=0.05;error=1.2;

% [data, label]=generate_sample(step,error);

category=load('category.mat');

label=category.label;

feature=load('feature.mat');

data=feature.data;

[num_data,d] = size(data); % 样本数量，维度，维度在下面好像没有用到

%% 定义向量机参数

alphas = ones(num_data,1)-0.999999;

b = 0;

error = zeros(num_data,2);

tol = 0.001;

C = 600000;

iter = 0;

max_iter = 30;

alpha_change = 0;

entireSet = 1;%作为一个标记看是选择全遍历还是部分遍历

%第一个变量先遍历间隔边界（0<alpha<C）上的支持向量点（此时松弛变量等于0），检验其是否满足KKT条件，若全部满足再遍历整个样本

%第一个变量选取违反KKT条件最严重的样本点所对应的变量，意思是首先更新最糟糕的点

%选择第二个变量要使得|E1-E2|最大，即使得乘子的变化最大，要用启发式标准

%第二个变量的选择好像是先看有没有违反KKT条件的点，若有则选择，若没有则按照|E1-E2|来选择

while (iter < max_iter) && ((alpha_change > 0) || entireSet)

    alpha_change = 0;

    % -----------全遍历样本-------------------------

    if entireSet

        for i = 1:num_data

            Ei = calEk(data,alphas,label,b,i);%计算误差

            %此处的条件既是选取第一个变量的标准，首先考虑的是间隔边界（0<alpha<C）上的支持向量点中不满足KKT条件的点所对应的变量

            %该条件困扰了我两天，实际上原来的写法过于虚伪，让人看不透摸不清，实际上写清楚了让人一看就明了。

            if (label(i)*Ei<-0.001 && alphas(i)<C)||(label(i)*Ei>0.001 && alphas(i)>0)

            %if (0<alphas(i) && alphas(i)<C && label(i)*Ei~=0)%写成这个形式要让alphas的初值大于零否则进不来循环体。

                %选择下一个alphas

                [j,Ej] = select(i,data,num_data,alphas,label,b,C,Ei,entireSet);

                alpha_I_old = alphas(i);

                alpha_J_old = alphas(j);

                if label(i) ~= label(j)

                    L = max(0,alphas(j) - alphas(i));

                    H = min(C,C + alphas(j) - alphas(i));

                else

                    L = max(0,alphas(j) + alphas(i) -C);

                    H = min(C,alphas(j) + alphas(i));

                end

                if L==H

                    continue;end

                eta = 2*data(i,:)*data(j,:)'- data(i,:)*...

                    data(i,:)' - data(j,:)*data(j,:)';

                if eta >= 0

                    continue;end

                alphas(j) = alphas(j) - label(j)*(Ei-Ej)/eta;

                %限制范围

                if alphas(j) > H

                    alphas(j) = H;

                elseif alphas(j) < L

                    alphas(j) = L;

                end

                if abs(alphas(j) - alpha_J_old) < 1e-4

                    continue;end

                alphas(i) = alphas(i) + label(i)*label(j)*(alpha_J_old-alphas(j));

                b1 = b - Ei - label(i)*(alphas(i)-alpha_I_old)*data(i,:)*data(i,:)'- label(j)*(alphas(j)-alpha_J_old)*data(i,:)*data(j,:)';

                b2 = b - Ej - label(i)*(alphas(i)-alpha_I_old)*data(i,:)*data(j,:)'- label(j)*(alphas(j)-alpha_J_old)*data(j,:)*data(j,:)';

                if (alphas(i) > 0) && (alphas(i) < C)

                    b = b1;

                elseif (alphas(j) > 0) && (alphas(j) < C)

                    b = b2;

                else

                    b = (b1+b2)/2;

                end

                alpha_change = alpha_change + 1;

            end

        end

         iter = iter + 1;

   % --------------部分遍历(alphas=0~C)的样本--------------------------

    else

        index = find(alphas>0 & alphas < C);

        for ii = 1:length(index)

            i = index(ii);

            Ei = calEk(data,alphas,label,b,i);%计算误差

            if (label(i)*Ei<-0.001 && alphas(i)<C)||...

                    (label(i)*Ei>0.001 && alphas(i)>0)

                %选择下一个样本

                [j,Ej] = select(i,data,num_data,alphas,label,b,C,Ei,entireSet);

                alpha_I_old = alphas(i);

                alpha_J_old = alphas(j);

                if label(i) ~= label(j)

                    L = max(0,alphas(j) - alphas(i));

                    H = min(C,C + alphas(j) - alphas(i));

                else

                    L = max(0,alphas(j) + alphas(i) -C);

                    H = min(C,alphas(j) + alphas(i));

                end

                if L==H

                    continue;end

                eta = 2*data(i,:)*data(j,:)'- data(i,:)*...

                    data(i,:)' - data(j,:)*data(j,:)';

                if eta >= 0

                    continue;end

                alphas(j) = alphas(j) - label(j)*(Ei-Ej)/eta;

                %限制范围

                if alphas(j) > H

                    alphas(j) = H;

                elseif alphas(j) < L

                    alphas(j) = L;

                end

                if abs(alphas(j) - alpha_J_old) < 1e-4

                    continue;end

                alphas(i) = alphas(i) + label(i)*...

                    label(j)*(alpha_J_old-alphas(j));

                b1 = b - Ei - label(i)*(alphas(i)-alpha_I_old)*...

                    data(i,:)*data(i,:)'- label(j)*...

                    (alphas(j)-alpha_J_old)*data(i,:)*data(j,:)';

                b2 = b - Ej - label(i)*(alphas(i)-alpha_I_old)*...

                    data(i,:)*data(j,:)'- label(j)*...

                    (alphas(j)-alpha_J_old)*data(j,:)*data(j,:)';

                if (alphas(i) > 0) && (alphas(i) < C)

                    b = b1;

                elseif (alphas(j) > 0) && (alphas(j) < C)

                    b = b2;

                else

                    b = (b1+b2)/2;

                end

                alpha_change = alpha_change + 1;

            end

        end

        iter = iter + 1;

    end

    % --------------------------------

    if entireSet %第一次全遍历了，下一次就变成部分遍历

        entireSet = 0;

    elseif alpha_change == 0

        %如果部分遍历所有都没有找到需要交换的alpha，再改为全遍历

        entireSet = 1;

    end

    disp(['iter ================== ',num2str(iter)]);

end

% 计算权值W

W = (alphas.*label)'*data;

%记录支持向量位置

index_sup = find(alphas ~= 0);

%计算预测结果

predict = (alphas.*label)'*(data*data') + b;

predict = sign(predict);

% 显示结果

figure;

index1 = find(predict==-1);

data1 = (data(index1,:))';

plot(data1(1,:),data1(2,:),'+r');

hold on

index2 = find(predict==1);

data2 = (data(index2,:))';

plot(data2(1,:),data2(2,:),'*');

hold on

dataw = (data(index_sup,:))';

plot(dataw(1,:),dataw(2,:),'og','LineWidth',2);

% 画出分界面，以及b上下正负1的分界面

hold on

k = -W(1)/W(2);

x = -1.2:0.1:1.2;

y = k*x + b;

plot(x,y,x,y-1,'r--',x,y+1,'r--');

title(['松弛变量范围C = ',num2str(C)]);

function Ek = calEk(data,alphas,label,b,k)

pre_Li = (alphas.*label)'*(data*data(k,:)') + b;

Ek = pre_Li - label(k);

function [J,Ej] = select(i,data,num_data,alphas,label,b,C,Ei,choose)

maxDeltaE = 0;maxJ = -1;

if choose == 1 %全遍历---随机选择alphas

    j = randi(num_data ,1);

    if j == i

        temp = 1;

        while temp

            j = randi(num_data,1);

            if j ~= i

                temp = 0;

            end

        end

    end

    J = j;

    Ej = calEk(data,alphas,label,b,J);

else %部分遍历--启发式的选择alphas

    index = find(alphas>0 & alphas < C);

    for k = 1:length(index)

        if i == index(k)

            continue;

        end

        temp_e = calEk(data,alphas,label,b,k);

        deltaE = abs(Ei - temp_e); %选择与Ei误差最大的alphas

        if deltaE > maxDeltaE

            maxJ = k;

            maxDeltaE = deltaE;

            Ej = temp_e;

        end

    end

    J = maxJ;

end

SMO启发式选择的更多相关文章

SVM之SMO最小序列
转载自:JerryLead http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988419.html 11 SMO优化算法(Sequential ...
SMO优化算法（Sequential minimal optimization）
原文:http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988419.html SMO算法由Microsoft Research的John C. ...
机器学习经典算法详解及Python实现--基于SMO的SVM分类器
原文:http://blog.csdn.net/suipingsp/article/details/41645779 支持向量机基本上是最好的有监督学习算法,因其英文名为support vector ...
Jordan Lecture Note-8: The Sequential Minimal Optimization Algorithm (SMO).
The Sequential Minimal Optimization Algorithm (SMO) 本文主要介绍用于解决SVM对偶模型的算法,它于1998年由John Platt在论文“Seque ...
SMO(Sequential Minimal Optimization) 伪代码（注释）
Algorithm: Simplified SMO 这个版本是简化版的,并没有采用启发式选择,但是比较容易理解. 输入: C: 调和系数 tol: 容差 (tolerance) max passes: ...
[笔记]关于支持向量机（SVM）中 SMO算法的学习（一）理论总结
1. 前言最近又重新复习了一遍支持向量机(SVM).其实个人感觉SVM整体可以分成三个部分: 1. SVM理论本身:包括最大间隔超平面(Maximum Margin Classifier),拉格朗日 ...
支持向量机(Support Vector Machine)-----SVM之SMO算法(转)
此文转自两篇博文有修改序列最小优化算法(英语:Sequential minimal optimization, SMO)是一种用于解决支持向量机训练过程中所产生优化问题的算法.SMO由微软研究院的 ...
支持向量机（五）SMO算法
11 SMO优化算法(Sequential minimal optimization) SMO算法由Microsoft Research的John C. Platt在1998年提出,并成为最快的二次规 ...
机器学习算法实践：Platt SMO 和遗传算法优化 SVM
机器学习算法实践:Platt SMO 和遗传算法优化 SVM 之前实现了简单的SMO算法来优化SVM的对偶问题,其中在选取α的时候使用的是两重循环通过完全随机的方式选取,具体的实现参考<机器学习 ...

随机推荐

MVC4建立DBContext的EF6数据
MVC4建立DBContext的EF6数据时 1.需要using System.Data.Entity;命名空间 2.此命名空间需要安装EntityFromwork.dll,此dll可以在项目——&g ...
css的clip裁剪
clip 属性是用来设置元素的形状.用来剪裁绝对定位元素(absolute or fixed). clip有三种取值:auto |inherit|rect.inherit是继承,ie不支持这个属性, ...
canvas在手机qq浏览器显示错乱
做大转盘的时候,使用html5 canvas 生成转盘,但在手机qq浏览器中显示错乱. 原本想在后台生成大转盘图片,后来想一想既然用图片来实现, 还不如直接由canvas 导出 toDataURL 在 ...
servlet方式通过Cookie记住登录时的用户名和密码
1.建立web工程 2.创建存放servlet的包 3右键包,新建servlet,路径将前面的servlet去掉,只需要doPost和doGet方法编写servlet CookieServlet.j ...
Android开发手记(13) 几种Alertdialog的使用
本文主要讨论七种形式的AlertDialog,及其编写方法. 1.退出在用户退出的时候提示用户是否退出,含有“确定”和“退出”两个按键. btnExit.setOnClickListener(new ...
Smokeping如何清空图标数据
先停smokeping服务 service smokeping stop 进去图表数据目录 /opt/smokeping/data /bin/rm -rf ./* 重新加载/opt/smokepi ...
linux入门。删除不用到内核，为boot分区释放空间
在终端中输入如下命令: dpkg --get-selections|grep linux-image 这时会列出系统中所有到内核. 你可以使用 uname -a 查看你当前使用到内核. 然后用 sud ...
MySql中的事务嵌套
1.Mysql中的事务必须是InnoDB.Berkeley DB引擎,myisam不支持. 2.Mysql是不支持嵌套事务的,开启了一个事务的情况下,再开启一个事务,会隐式的提交上一个事务. 3.My ...
javascript 倒计时代码
<script language="javascript" type="text/javascript"> var interval = 1000; ...
Android Init进程命令的执行和服务的启动
这里开始分析init进程中配置文件的解析,在配置文件中的命令的执行和服务的启动. 首先init是一个可执行文件,它的对应的Makfile是init/Android.mk. Android.mk定义了i ...

SMO启发式选择

SMO启发式选择的更多相关文章

随机推荐

热门专题