支持向量机(SVM)——python3实现

　　今天看完soft-margin SVM就又搜了下相关的代码，最后搜到这个，第一次看懂了SVM的实现。

　　关于代码中cvxopt的使用，可以看下这个简单的介绍。

　　这里还是将代码贴在这里，里面加了自己的一下注释。

 # -*- coding: utf-8 -*-

 """

 Created on Tue Nov 22 11:24:22 2016

 @author: Administrator

 """

 # Mathieu Blondel, September 2010

 # License: BSD 3 clause

 import numpy as np

 from numpy import linalg

 import cvxopt

 import cvxopt.solvers

 def linear_kernel(x1, x2):

     return np.dot(x1, x2)

 def polynomial_kernel(x, y, p=3):

     return (1 + np.dot(x, y)) ** p

 def gaussian_kernel(x, y, sigma=5.0):

     return np.exp(-linalg.norm(x-y)**2 / (2 * (sigma ** 2)))

 class SVM(object):

     def __init__(self, kernel=linear_kernel, C=None):

         self.kernel = kernel

         self.C = C

         if self.C is not None: self.C = float(self.C)

     def fit(self, X, y):

         n_samples, n_features = X.shape

         # Gram matrix

         K = np.zeros((n_samples, n_samples))

         for i in range(n_samples):

             for j in range(n_samples):

                 K[i,j] = self.kernel(X[i], X[j])

         P = cvxopt.matrix(np.outer(y,y) * K)

         q = cvxopt.matrix(np.ones(n_samples) * -1)

         A = cvxopt.matrix(y, (1,n_samples))

         b = cvxopt.matrix(0.0)

         if self.C is None:

             G = cvxopt.matrix(np.diag(np.ones(n_samples) * -1))

             h = cvxopt.matrix(np.zeros(n_samples))

         else:

             tmp1 = np.diag(np.ones(n_samples) * -1)

             tmp2 = np.identity(n_samples)

             G = cvxopt.matrix(np.vstack((tmp1, tmp2)))

             tmp1 = np.zeros(n_samples)

             tmp2 = np.ones(n_samples) * self.C

             h = cvxopt.matrix(np.hstack((tmp1, tmp2)))

         # solve QP problem

         solution = cvxopt.solvers.qp(P, q, G, h, A, b)

         # Lagrange multipliers

         '''

          数组的flatten和ravel方法将数组变为一个一维向量（铺平数组）。

          flatten方法总是返回一个拷贝后的副本，

          而ravel方法只有当有必要时才返回一个拷贝后的副本（所以该方法要快得多，尤其是在大数组上进行操作时）

        '''

         a = np.ravel(solution['x'])

         # Support vectors have non zero lagrange multipliers

         '''

         这里a>1e-5就将其视为非零

         '''

         sv = a > 1e-5     # return a list with bool values

         ind = np.arange(len(a))[sv]  # sv's index

         self.a = a[sv]

         self.sv = X[sv]  # sv's data

         self.sv_y = y[sv]  # sv's labels

         print("%d support vectors out of %d points" % (len(self.a), n_samples))

         # Intercept

         '''

         这里相当于对所有的支持向量求得的b取平均值

         '''

         self.b = 0

         for n in range(len(self.a)):

             self.b += self.sv_y[n]

             self.b -= np.sum(self.a * self.sv_y * K[ind[n],sv])

         self.b /= len(self.a)

         # Weight vector

         if self.kernel == linear_kernel:

             self.w = np.zeros(n_features)

             for n in range(len(self.a)):

                 # linear_kernel相当于在原空间，故计算w不用映射到feature space

                 self.w += self.a[n] * self.sv_y[n] * self.sv[n]

         else:

             self.w = None

     def project(self, X):

         # w有值，即kernel function 是 linear_kernel，直接计算即可

         if self.w is not None:

             return np.dot(X, self.w) + self.b

         # w is None --> 不是linear_kernel,w要重新计算

         # 这里没有去计算新的w（非线性情况不用计算w）,直接用kernel matrix计算预测结果

         else:

             y_predict = np.zeros(len(X))

             for i in range(len(X)):

                 s = 0

                 for a, sv_y, sv in zip(self.a, self.sv_y, self.sv):

                     s += a * sv_y * self.kernel(X[i], sv)

                 y_predict[i] = s

             return y_predict + self.b

     def predict(self, X):

         return np.sign(self.project(X))

 if __name__ == "__main__":

     import pylab as pl

     def gen_lin_separable_data():

         # generate training data in the 2-d case

         mean1 = np.array([0, 2])

         mean2 = np.array([2, 0])

         cov = np.array([[0.8, 0.6], [0.6, 0.8]])

         X1 = np.random.multivariate_normal(mean1, cov, 100)

         y1 = np.ones(len(X1))

         X2 = np.random.multivariate_normal(mean2, cov, 100)

         y2 = np.ones(len(X2)) * -1

         return X1, y1, X2, y2

     def gen_non_lin_separable_data():

         mean1 = [-1, 2]

         mean2 = [1, -1]

         mean3 = [4, -4]

         mean4 = [-4, 4]

         cov = [[1.0,0.8], [0.8, 1.0]]

         X1 = np.random.multivariate_normal(mean1, cov, 50)

         X1 = np.vstack((X1, np.random.multivariate_normal(mean3, cov, 50)))

         y1 = np.ones(len(X1))

         X2 = np.random.multivariate_normal(mean2, cov, 50)

         X2 = np.vstack((X2, np.random.multivariate_normal(mean4, cov, 50)))

         y2 = np.ones(len(X2)) * -1

         return X1, y1, X2, y2

     def gen_lin_separable_overlap_data():

         # generate training data in the 2-d case

         mean1 = np.array([0, 2])

         mean2 = np.array([2, 0])

         cov = np.array([[1.5, 1.0], [1.0, 1.5]])

         X1 = np.random.multivariate_normal(mean1, cov, 100)

         y1 = np.ones(len(X1))

         X2 = np.random.multivariate_normal(mean2, cov, 100)

         y2 = np.ones(len(X2)) * -1

         return X1, y1, X2, y2

     def split_train(X1, y1, X2, y2):

         X1_train = X1[:90]

         y1_train = y1[:90]

         X2_train = X2[:90]

         y2_train = y2[:90]

         X_train = np.vstack((X1_train, X2_train))

         y_train = np.hstack((y1_train, y2_train))

         return X_train, y_train

     def split_test(X1, y1, X2, y2):

         X1_test = X1[90:]

         y1_test = y1[90:]

         X2_test = X2[90:]

         y2_test = y2[90:]

         X_test = np.vstack((X1_test, X2_test))

         y_test = np.hstack((y1_test, y2_test))

         return X_test, y_test

     # 仅仅在Linears使用此函数作图，即w存在时

     def plot_margin(X1_train, X2_train, clf):

         def f(x, w, b, c=0):

             # given x, return y such that [x,y] in on the line

             # w.x + b = c

             return (-w[0] * x - b + c) / w[1]

         pl.plot(X1_train[:,0], X1_train[:,1], "ro")

         pl.plot(X2_train[:,0], X2_train[:,1], "bo")

         pl.scatter(clf.sv[:,0], clf.sv[:,1], s=100, c="g")

         # w.x + b = 0

         a0 = -4; a1 = f(a0, clf.w, clf.b)

         b0 = 4; b1 = f(b0, clf.w, clf.b)

         pl.plot([a0,b0], [a1,b1], "k")

         # w.x + b = 1

         a0 = -4; a1 = f(a0, clf.w, clf.b, 1)

         b0 = 4; b1 = f(b0, clf.w, clf.b, 1)

         pl.plot([a0,b0], [a1,b1], "k--")

         # w.x + b = -1

         a0 = -4; a1 = f(a0, clf.w, clf.b, -1)

         b0 = 4; b1 = f(b0, clf.w, clf.b, -1)

         pl.plot([a0,b0], [a1,b1], "k--")

         pl.axis("tight")

         pl.show()

     def plot_contour(X1_train, X2_train, clf):

         # 作training sample数据点的图

         pl.plot(X1_train[:,0], X1_train[:,1], "ro")

         pl.plot(X2_train[:,0], X2_train[:,1], "bo")

         # 做support vectors 的图

         pl.scatter(clf.sv[:,0], clf.sv[:,1], s=100, c="g")

         X1, X2 = np.meshgrid(np.linspace(-6,6,50), np.linspace(-6,6,50))

         X = np.array([[x1, x2] for x1, x2 in zip(np.ravel(X1), np.ravel(X2))])

         Z = clf.project(X).reshape(X1.shape)

         # pl.contour做等值线图

         pl.contour(X1, X2, Z, [0.0], colors='k', linewidths=1, origin='lower')

         pl.contour(X1, X2, Z + 1, [0.0], colors='grey', linewidths=1, origin='lower')

         pl.contour(X1, X2, Z - 1, [0.0], colors='grey', linewidths=1, origin='lower')

         pl.axis("tight")

         pl.show()

     def test_linear():

         X1, y1, X2, y2 = gen_lin_separable_data()

         X_train, y_train = split_train(X1, y1, X2, y2)

         X_test, y_test = split_test(X1, y1, X2, y2)

         clf = SVM()

         clf.fit(X_train, y_train)

         y_predict = clf.predict(X_test)

         correct = np.sum(y_predict == y_test)

         print("%d out of %d predictions correct" % (correct, len(y_predict)))

         plot_margin(X_train[y_train==1], X_train[y_train==-1], clf)

     def test_non_linear():

         X1, y1, X2, y2 = gen_non_lin_separable_data()

         X_train, y_train = split_train(X1, y1, X2, y2)

         X_test, y_test = split_test(X1, y1, X2, y2)

         clf = SVM(gaussian_kernel)

         clf.fit(X_train, y_train)

         y_predict = clf.predict(X_test)

         correct = np.sum(y_predict == y_test)

         print("%d out of %d predictions correct" % (correct, len(y_predict)))

         plot_contour(X_train[y_train==1], X_train[y_train==-1], clf)

     def test_soft():

         X1, y1, X2, y2 = gen_lin_separable_overlap_data()

         X_train, y_train = split_train(X1, y1, X2, y2)

         X_test, y_test = split_test(X1, y1, X2, y2)

         clf = SVM(C=0.1)

         clf.fit(X_train, y_train)

         y_predict = clf.predict(X_test)

         correct = np.sum(y_predict == y_test)

         print("%d out of %d predictions correct" % (correct, len(y_predict)))

         plot_contour(X_train[y_train==1], X_train[y_train==-1], clf)

     # test_soft()

     # test_linear()

     test_non_linear()

　　运行结果：

支持向量机(SVM)——python3实现的更多相关文章

【IUML】支持向量机SVM
从1995年Vapnik等人提出一种机器学习的新方法支持向量机(SVM)之后,支持向量机成为继人工神经网络之后又一研究热点,国内外研究都很多.支持向量机方法是建立在统计学习理论的VC维理论和结构风险最 ...
机器学习：Python中如何使用支持向量机(SVM)算法
(简单介绍一下支持向量机,详细介绍尤其是算法过程可以查阅其他资) 在机器学习领域,支持向量机SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别.分类(异 ...
以图像分割为例浅谈支持向量机(SVM)
1. 什么是支持向量机? 在机器学习中,分类问题是一种非常常见也非常重要的问题.常见的分类方法有决策树.聚类方法.贝叶斯分类等等.举一个常见的分类的例子.如下图1所示,在平面直角坐标系中,有一些点 ...
机器学习算法 - 支持向量机SVM
在上两节中,我们讲解了机器学习的决策树和k-近邻算法,本节我们讲解另外一种分类算法:支持向量机SVM. SVM是迄今为止最好使用的分类器之一,它可以不加修改即可直接使用,从而得到低错误率的结果. [案 ...
机器学习之支持向量机—SVM原理代码实现
支持向量机—SVM原理代码实现本文系作者原创,转载请注明出处:https://www.cnblogs.com/further-further-further/p/9596898.html 1. 解决 ...
支持向量机SVM——专治线性不可分
SVM原理线性可分与线性不可分线性可分线性不可分-------[无论用哪条直线都无法将女生情绪正确分类] SVM的核函数可以帮助我们: 假设‘开心’是轻飘飘的,“不开心”是沉重的将三维视图还原 ...
一步步教你轻松学支持向量机SVM算法之案例篇2
一步步教你轻松学支持向量机SVM算法之案例篇2 (白宁超 2018年10月22日10:09:07) 摘要:支持向量机即SVM(Support Vector Machine) ,是一种监督学习算法,属于 ...
一步步教你轻松学支持向量机SVM算法之理论篇1
一步步教你轻松学支持向量机SVM算法之理论篇1 (白宁超 2018年10月22日10:03:35) 摘要:支持向量机即SVM(Support Vector Machine) ,是一种监督学习算法,属于 ...
OpenCV 学习笔记 07 支持向量机SVM（flag）
1 SVM 基本概念本章节主要从文字层面来概括性理解 SVM. 支持向量机(support vector machine,简SVM)是二类分类模型. 在机器学习中,它在分类与回归分析中分析数据的监督 ...

随机推荐

《精通C#》十四章-.NET程序集入门
在书中,这一章节的开头说的是自定义命名空间和使用命名空间,在以我目前有限的经验来说,程序集就是一个类库经过编译之后,所生成的一个在引用命名空间,进而使用该文件中已经定义好的字段,属性以及方法的文件,以 ...
[转]Bat脚本处理ftp超强案例解说
Bat脚本处理ftp超强案例解说转自:http://369369.blog.51cto.com/319630/842341 前言: 公司有几百台windows服务器,每次程序更新,如果是一台 ...
curl --connect-timeout 判断国内外网络windows 批处理
1.下载编译curl curl 下载地址:http://curl.haxx.se/download.html ,下载后解压到一个目录,使用vs开发者工具里的 “Visual Studio 命令提示(2 ...
Amazon EC2免费VPS防止超额被扣钱三大方法:流量硬盘读写运行时长
Amazon EC2也就是亚马逊云服务免费VPS主机服务,内存是613MB,月流量是30GB,主机空间是30GB,可以免费使用一年,又加上Amazon服务器全球多个节点CDN和本身的名气,早在2010 ...
HDU 5010 Get the Nut(2014 ACM/ICPC Asia Regional Xi'an Online)
思路:广搜, 因为空格加上动物最多只有32个那么对这32个进行编号,就能可以用一个数字来表示状态了,因为只有 ‘P’ 'S' 'M' '.' 那么就可以用4进制刚好可以用64位表示. 接下去每次就 ...
Hibernate实体关系映射(OneToMany单边)——完整实例
单边一对多关系:电子邮件管理单边一对多关系:指一方有集合属性,包含多个多方,而多的一方没有一方的引用. 比如:用户(一)与电子邮件(多).一个用户可以有多个电子邮件记录. 目的:通过OneToMan ...
《JavaScript高级程序设计》读书笔记--前言
起因 web编程过程使用javascript时感觉很吃力,效率很低.根本原因在于对javascript整个知识体系不熟,看来需要找些书脑补一下,同时欢迎众网友监督. 大神推荐书籍看了博客大神们推荐的 ...
dll学习
Dll:动态链接库动态链接库(dll)是包含共享函数库的二进制文件,可以被多个应用程序同时使用.建立应用程序的可执行文件时,不必将DLL连接到应用程序中,而是在运行时动态装载DLL,装载时DLL被映 ...
SQLServer存储过程和触发器学习记录及简单例子
一.存储过程存储过程即为能完成特定功能的一组SQL语句集.如果需要对查出的多条数据进行操作的话,这里需要理解游标(CURSOR)的概念,对于oracle有for each row命令,可以不用游标 ...
Intellij IDEA 创建Web项目并在Tomcat中部署运行（不使用maven）【转载】
原文链接:http://www.thinksaas.cn/topics/0/350/350000.html 一.创建Web项目 1.File -> New Module,进入创建项目窗口 2.选 ...

支持向量机(SVM)——python3实现

支持向量机(SVM)——python3实现的更多相关文章

随机推荐

热门专题