基于SVM的鸢尾花数据集分类实现[使用Matlab]

　　iris数据集的中文名是安德森鸢尾花卉数据集，英文全称是Anderson’s Iris data set。iris包含150个样本，对应数据集的每行数据。每行数据包含每个样本的四个特征和样本的类别信息，所以iris数据集是一个150行5列的二维表。通俗地说，iris数据集是用来给花做分类的数据集，每个样本包含了花萼长度、花萼宽度、花瓣长度、花瓣宽度四个特征（前4列），我们需要建立一个分类器，分类器可以通过样本的四个特征来判断样本属于山鸢尾、变色鸢尾还是维吉尼亚鸢尾（这三个名词都是花的品种）。

数据的获取：

file=importdata('iris.csv');%读取csv文件中从第R-1行，第C-1列的数据开始的数据

data=file.data;

features=data(:,:);%特征列表

classlabel=data(:,);%对应类别

n = randperm(size(features,));%随机产生训练集和测试集

绘制散点图查看数据：

%% 绘制散点图

class_0 = find(data(:,)==);

class_1 = find(data(:,)==);

class_2 = find(data(:,)==);%返回类别为2的位置索引

subplot(,,)

hold on

scatter(features(class_0,),features(class_0,),'x','b')

scatter(features(class_1,),features(class_1,),'+','g')

scatter(features(class_2,),features(class_2,),'o','r')

subplot(,,)

hold on

scatter(features(class_0,),features(class_0,),'x','b')

scatter(features(class_1,),features(class_1,),'+','g')

scatter(features(class_2,),features(class_2,),'o','r')

subplot(,,)

hold on

scatter(features(class_0,),features(class_0,),'x','b')

scatter(features(class_1,),features(class_1,),'+','g')

scatter(features(class_2,),features(class_2,),'o','r')

subplot(,,)

hold on

scatter(features(class_0,),features(class_0,),'x','b')

scatter(features(class_1,),features(class_1,),'+','g')

scatter(features(class_2,),features(class_2,),'o','r')

subplot(,,)

hold on

scatter(features(class_0,),features(class_0,),'x','b')

scatter(features(class_1,),features(class_1,),'+','g')

scatter(features(class_2,),features(class_2,),'o','r')

subplot(,,)

hold on

scatter(features(class_0,),features(class_0,),'x','b')

scatter(features(class_1,),features(class_1,),'+','g')

scatter(features(class_2,),features(class_2,),'o','r')

　　曲线为根据花萼长度、花萼宽度、花瓣长度、花瓣宽度之间的关系绘制的散点图。

训练集与测试集：

%% 训练集--70个样本

train_features=features(n(:),:);

train_label=classlabel(n(:),:);

%% 测试集--30个样本

test_features=features(n(:end),:);

test_label=classlabel(n(:end),:);

数据归一化：

%% 数据归一化

 [Train_features,PS] = mapminmax(train_features');

 Train_features = Train_features';

 Test_features = mapminmax('apply',test_features',PS);

 Test_features = Test_features';

使用SVM进行分类：

%% 创建/训练SVM模型

model = svmtrain(train_label,Train_features);

%% SVM仿真测试

[predict_train_label] = svmpredict(train_label,Train_features,model);

[predict_test_label] = svmpredict(test_label,Test_features,model);

%% 打印准确率

compare_train = (train_label == predict_train_label);

accuracy_train = sum(compare_train)/size(train_label,)*;

fprintf('训练集准确率：%f\n',accuracy_train)

compare_test = (test_label == predict_test_label);

accuracy_test = sum(compare_test)/size(test_label,)*;

fprintf('测试集准确率：%f\n',accuracy_test)

结果：

*
optimization finished, #iter = 18
nu = 0.668633
obj = -21.678546, rho = 0.380620
nSV = 30, nBSV = 28
*
optimization finished, #iter = 29
nu = 0.145900
obj = -3.676315, rho = -0.010665
nSV = 9, nBSV = 4
*
optimization finished, #iter = 21
nu = 0.088102
obj = -2.256080, rho = -0.133432
nSV = 7, nBSV = 2
Total nSV = 40
Accuracy = 97.1429% (68/70) (classification)
Accuracy = 97.5% (78/80) (classification)
训练集准确率：97.142857
测试集准确率：97.500000

基于SVM的鸢尾花数据集分类实现[使用Matlab]的更多相关文章

Python实现鸢尾花数据集分类问题——基于skearn的SVM
Python实现鸢尾花数据集分类问题——基于skearn的SVM 代码如下: # !/usr/bin/env python # encoding: utf-8 __author__ = 'Xiaoli ...
Python实现鸢尾花数据集分类问题——基于skearn的NaiveBayes
Python实现鸢尾花数据集分类问题——基于skearn的NaiveBayes 代码如下: # !/usr/bin/env python # encoding: utf-8 __author__ = ...
Python实现鸢尾花数据集分类问题——基于skearn的LogisticRegression
Python实现鸢尾花数据集分类问题——基于skearn的LogisticRegression 一. 逻辑回归逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题, ...
python实现HOG+SVM对CIFAR-10数据集分类（上）
本博客只用于学习,如果有错误的地方,恳请指正,如需转载请注明出处. 看机器学习也是有一段时间了,这两天终于勇敢地踏出了第一步,实现了HOG+SVM对图片分类,具体代码可以在github上下载,http ...
Python实现鸢尾花数据集分类问题——使用LogisticRegression分类器
. 逻辑回归逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法. 概率p与因变量往 ...
ML学习笔记之XGBoost实现对鸢尾花数据集分类预测
import xgboost as xgb import numpy as np import pandas as pd from sklearn.model_selection import tra ...
基于SKLearn的SVM模型垃圾邮件分类——代码实现及优化
一. 前言由于最近有一个邮件分类的工作需要完成,研究了一下基于SVM的垃圾邮件分类模型.参照这位作者的思路(https://blog.csdn.net/qq_40186809/article/det ...
做一个logitic分类之鸢尾花数据集的分类
做一个logitic分类之鸢尾花数据集的分类 Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例.数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都 ...
实验一使用sklearn的决策树实现iris鸢尾花数据集的分类
使用sklearn的决策树实现iris鸢尾花数据集的分类要求: 建立分类模型,至少包含4个剪枝参数:max_depth.min_samples_leaf .min_samples_split.max ...

随机推荐

-1-0 Java 简介 java是什么 java简单介绍
Java是一门纯粹的面向对象的高级的平台无关的编程语言官网介绍: 了解 Java 技术 https://www.java.com/zh_CN/about/ 推荐词条: https://zh.wik ...
Python3+Selenium2完整的自动化测试实现之旅（七）：完整的轻量级自动化框架实现
一.前言前面系列Python3+Selenium2自动化系列博文,陆陆续续总结了自动化环境最基础环境的搭建.IE和Chrome浏览器驱动配置.selenium下的webdriver模块提供的元素定位 ...
解读经典《C#高级编程》泛型页122-127.章4
前言本篇继续讲解泛型.上一篇讲解了泛型类的创建.本篇讲解泛型类创建和使用的细节. 泛型类上篇举了个我产品中用到的例子,本篇的功能可以对照着此案例进行理解. /// <summary> ...
练习使用 __attribute__ 属性(仿照内核)
上一篇文章分析了内核中各种 initcall 的调用过程,在这个基础上大概掌握了内核中使用的这种方法,于是参考内核及网友的文章自己动手写了下,记录在这个随笔中. 源代码如下: #include < ...
Elasticsearch.net项目实战
elasticsearch.net项目实战目录 Elasticsearch+kibana 环境搭建 windows 10环境配置安装Elasticsearch head安装(非必需) 安装kiba ...
C# 如何在Excel表格中插入、编辑和删除批注
概述为文档添加必要的批注可以给文档使用者提供重要的提示信息,下面的示例中,将介绍通过C#编程语言来给Excel表格中的指定单元格内容添加批注,此外,对于已有的批注,如果需要修改,我们也可以进行编辑或 ...
Java开发笔记（十五）短路逻辑运算的优势
前面提到逻辑运算只能操作布尔变量,这其实是不严谨的,因为经过Java编程实现,会发现“&”.“|”.“^”这几个逻辑符号竟然可以对数字进行运算.譬如下面的代码就直接对数字分别开展了“与”.“或 ...
Spring框架基础（下）
log4J 导入log4J.jar 创建log4J.properties # Create a file called log4j.properties as shown below and plac ...
vue点击按钮给商品按照价格进行倒叙
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
一种提升连接Dynamics 365性能的方法
关注本人微信和易信公众号: 微软动态CRM专家罗勇 ,回复256或者20170512可方便获取本文,同时可以在第一间得到我发布的最新的博文信息,follow me!我的网站是 www.luoyong. ...

基于SVM的鸢尾花数据集分类实现[使用Matlab]

数据的获取：

绘制散点图查看数据：

训练集与测试集：

数据归一化：

使用SVM进行分类：

结果：

基于SVM的鸢尾花数据集分类实现[使用Matlab]的更多相关文章

随机推荐

热门专题