在opencv3中实现机器学习算法之：利用最近邻算法（knn)实现手写数字分类

手写数字digits分类，这可是深度学习算法的入门练习。而且还有专门的手写数字MINIST库。opencv提供了一张手写数字图片给我们，先来看看

这是一张密密麻麻的手写数字图：图片大小为1000*2000,有0-9的10个数字，每5行为一个数字，总共50行，共有5000个手写数字。在opencv3.0版本中，图片存放位置为

/opencv/sources/samples/data/digits.png

我们首先要做的，就是把这5000个手写数字，一个个截取出来，每个数字块大小为20*20。直接将每个小图块进行序列化，因此最终得到一个5000*400的特征矩阵。样本数为5000，维度为400维。取其中前3000个样本进行训练。

注意：截取的时候，是按列截取。不然取前3000个样本进行训练就会出现后几个数字训练不到。

具体代码：

#include "stdafx.h"

#include "opencv2\opencv.hpp"

#include <iostream>

using namespace std;

using namespace cv;

using namespace cv::ml;

int main()

{

    Mat img = imread("E:/opencv/opencv/sources/samples/data/digits.png");

    Mat gray;

    cvtColor(img, gray, CV_BGR2GRAY);

    int b = ;

    int m = gray.rows / b;   //原图为1000*2000

    int n = gray.cols / b;   //裁剪为5000个20*20的小图块

    Mat data,labels;   //特征矩阵

    for (int i = ; i < n; i++)

    {

        int offsetCol = i*b; //列上的偏移量

        for (int j = ; j < m; j++)

        {

            int offsetRow = j*b;  //行上的偏移量

            //截取20*20的小块

            Mat tmp;

            gray(Range(offsetRow, offsetRow + b), Range(offsetCol, offsetCol + b)).copyTo(tmp);

            data.push_back(tmp.reshape(,));  //序列化后放入特征矩阵

            labels.push_back((int)j / );  //对应的标注

        }

    }

    data.convertTo(data, CV_32F); //uchar型转换为cv_32f

    int samplesNum = data.rows;

    int trainNum = ;

    Mat trainData, trainLabels;

    trainData = data(Range(, trainNum), Range::all());   //前3000个样本为训练数据

    trainLabels = labels(Range(, trainNum), Range::all());

    //使用KNN算法

    int K = ;

    Ptr<TrainData> tData = TrainData::create(trainData, ROW_SAMPLE, trainLabels);

    Ptr<KNearest> model = KNearest::create();

    model->setDefaultK(K);

    model->setIsClassifier(true);

    model->train(tData);

    //预测分类

    double train_hr = , test_hr = ;

    Mat response;

    // compute prediction error on train and test data

    for (int i = ; i < samplesNum; i++)

    {

        Mat sample = data.row(i);

        float r = model->predict(sample);   //对所有行进行预测

        //预测结果与原结果相比，相等为1，不等为0

        r = std::abs(r - labels.at<int>(i)) <= FLT_EPSILON ? .f : .f;          

        if (i < trainNum)

            train_hr += r;  //累积正确数

        else

            test_hr += r;

    }

    test_hr /= samplesNum - trainNum;

    train_hr = trainNum >  ? train_hr / trainNum : .;

    printf("accuracy: train = %.1f%%, test = %.1f%%\n",

        train_hr*., test_hr*.);

    waitKey();

    return ;

}

根据经验，利用最近邻算法对手写数字进行分类，会有很高的精度，因此在本文中我们采用的是knn算法。

最终结果：

训练精度为95.9%, 测试精度为92.6%。如果对手写数字识别准确率达不到90%以上，就没有什么实际作用了。如果调整训练样本数，这个精度应该会有所改变。

在opencv3中实现机器学习算法之：利用最近邻算法（knn)实现手写数字分类的更多相关文章

在opencv3中实现机器学习之：利用逻辑斯谛回归（logistic regression)分类
logistic regression,注意这个单词logistic ,并不是逻辑(logic)的意思,音译过来应该是逻辑斯谛回归,或者直接叫logistic回归,并不是什么逻辑回归.大部分人都叫成逻 ...
吴裕雄--天生自然python机器学习实战：K-NN算法约会网站好友喜好预测以及手写数字预测分类实验
实验设备与软件环境硬件环境:内存ddr3 4G及以上的x86架构主机一部系统环境:windows 软件环境:Anaconda2(64位),python3.5,jupyter 内核版本:window ...
TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别（MNIST）
从这篇文章开始,终于要干点正儿八经的工作了,前面都是准备工作.这次我们要解决机器学习的经典问题,MNIST手写数字识别. 首先介绍一下数据集.请首先解压:TF_Net\Asset\mnist_png. ...
在opencv3中实现机器学习之：利用svm(支持向量机)分类
svm分类算法在opencv3中有了很大的变动,取消了CvSVMParams这个类,因此在参数设定上会有些改变. opencv中的svm分类代码,来源于libsvm. #include "s ...
在opencv3中实现机器学习之：利用正态贝叶斯分类
opencv3.0版本中,实现正态贝叶斯分类器(Normal Bayes Classifier)分类实例 #include "stdafx.h" #include "op ...
在opencv3中的机器学习算法
在opencv3.0中,提供了一个ml.cpp的文件,这里面全是机器学习的算法,共提供了这么几种: 1.正态贝叶斯:normal Bayessian classifier 我已在另外一篇博文中介 ...
机器学习（二）-kNN手写数字识别
一.kNN算法是机器学习的入门算法,其中不涉及训练,主要思想是计算待测点和参照点的距离,选取距离较近的参照点的类别作为待测点的的类别. 1,距离可以是欧式距离,夹角余弦距离等等. 2,k值不能选择太大 ...
手写数字识别的k-近邻算法实现
(本文为原创,请勿在未经允许的情况下转载) 前言手写字符识别是机器学习的入门问题,k-近邻算法(kNN算法)是机器学习的入门算法.本文将介绍k-近邻算法的原理.手写字符识别问题分析.手写字符识别的k ...
TensorFlow下利用MNIST训练模型识别手写数字
本文将参考TensorFlow中文社区官方文档使用mnist数据集训练一个多层卷积神经网络(LeNet5网络),并利用所训练的模型识别自己手写数字. 训练MNIST数据集,并保存训练模型 # Pyth ...

随机推荐

LeetCode 5 Longest Palindromic Substring（最长子序列）
题目来源:https://leetcode.com/problems/longest-palindromic-substring/ Given a string S, find the longest ...
如何解决"应用程序无法启动,因为应用程序的并行配置不正确"问题
应用程序事件日志中: "C:\windows\system32\test.exe"的激活上下文生成失败.找不到从属程序集 Microsoft.VC80.MFC,processorA ...
android之旋转的刻度盘
这是在学习android的Canvas绘图技巧时做的一个实例.主要用的核心方法就是canvas.save,canvas.rotate, canvas.translate以及canvas.restore ...
如何在Java Filter 中注入 Service
在项目中遇到一个问题,在 Filter中注入 Serivce失败,注入的service始终为null.如下所示: public class WeiXinFilter implements Filter ...
[转][原]openstack-kilo--issue(六)kilo版openstack的dashboard在session超时后重新登录报错解决办法
http://blog.csdn.net/wylfengyujiancheng/article/details/50523373?locationNum=1&fps=1 1.现象描述: kil ...
jQuery Form 表单提交插件-----ajaxSubmit() 的应用
Form Plugin API 里提供了很多有用的方法可以让你轻松的处理表单里的数据和表单的提交过程. 测试环境:部署到Tomcat中的web项目. 一.ajaxSubmit() 介绍立即通过AJ ...
记一次zookeeper集群搭建错误的排除
zookeeper官网上的文档说得很清楚. http://zookeeper.apache.org/doc/r3.5.1-alpha/zookeeperAdmin.html#sc_designing ...
uva 839 not so mobile——yhx
Not so Mobile Before being an ubiquous communications gadget, a mobile was just a structure made of ...
jmeter的使用（一）
1.下载jmeter:http://jmeter.apache.org/download_jmeter.cgi 2.启动jmeter,打开jmeter.bat 3.添加线程组 4.添加http请求 5 ...
JavaWeb学习----JSP简介及入门（含Eclipse for Java EE及Tomcat的配置）
[声明] 欢迎转载,但请保留文章原始出处→_→ 生命壹号:http://www.cnblogs.com/smyhvae/ 文章来源:http://www.cnblogs.com/smyhvae/p/ ...

在opencv3中实现机器学习算法之：利用最近邻算法（knn)实现手写数字分类

在opencv3中实现机器学习算法之：利用最近邻算法（knn)实现手写数字分类的更多相关文章

随机推荐

热门专题