opencv 手写选择题阅卷 (三)训练分类器
opencv 手写选择题阅卷 (三)训练分类器
1,分类器选择:SVM
本来一开始用的KNN分类器,但这个分类器目前没有实现保存训练数据的功能,所以选择了SVN分类器;
2,样本图像的预处理和特征提取代码与识别代码中使用一样的代码.
3,训练时的输入数据主要为两个矩阵,一个矩阵保存所有样本的特征数据,每一行一个图像,另一个矩阵保存每个样本所属的类别,比如 1.0代表A,2.0代表B,0代表空白.
4,所有样本分别保存在5个文件夹中(一个是空白,四个字母ABCD),用批处理生成一个文本文件包括所有样本文件文件名和分类:
目前只使用了四个人书写的60个字母和几个空白样本,后期再增加更多人的更多样本,文本文件内容如下样式:
1 A\2016072316013018.png
1 A\2016072316013022.png
1 A\2016072316013026.png
2 B\2016072316010401.png
2 B\2016072316010405.png
2 B\2016072316010409.png
;//每个字符多个个图片 FILE * pf = fopen(listname,"r"); if (pf == NULL){ printf("没有发现样本列表文件;\n"); return; } ]; ){ , pf)) break; ) continue; n_img++; } HOGDescriptor *hog = , ), cvSize(, ), cvSize(, ), cvSize(, ), ); int nw = hog->getDescriptorSize(); CvMat * trainData = cvCreateMat(n_img, nw, CV_32FC1); CvMat * trainClasses = cvCreateMat(n_img, , CV_32FC1); //每个样本都要提取特征,写入到训练矩阵 ] = ""; strcpy(path, listname); int path_len = strlen(listname); ; i--){ if (path[i] == '\\'){ path[i+] = '\0'; break; } } fseek(pf, , SEEK_SET); ;//训练数据中的第N个 ){ , pf)) break; ) continue; char * str_lable = line; char * str_imgname = NULL; int line_len = strlen(line); ; i < line_len; i++) { if (line[i] == ' '){ line[i] == '\0'; str_imgname = line + i + ; break; } } if (str_imgname == NULL) continue; ] = ""; strcpy(img_name, path); strcat(img_name, str_imgname); img_name[strlen(img_name) - ] = '\0'; IplImage* src = cvLoadImage(img_name, ); if (src == NULL) { printf("打开样本图片出错:%s;\n", img_name); continue; } IplImage* train_img = cvCreateImage(cvSize(, ), , ); preproc_img(src, train_img); vector<float> descriptors;//存放结果 hog->compute(train_img, descriptors, Size(, ), Size(, )); //Hog特征计算 ; for (vector<float>::iterator iter = descriptors.begin(); iter != descriptors.end(); iter++) { cvmSet(trainData, nItem, n, *iter);//存储HOG特征 n++; } double val = strtod(str_lable, NULL); cvmSet(trainClasses, nItem, , val); cvReleaseImage(&src); cvReleaseImage(&train_img); nItem++; } if (nItem != n_img){ printf("实际样本数据与列表中样本数据不同;\n"); } fclose(pf); CvSVM svm;//新建一个SVM CvSVMParams param;//这里是SVM训练相关参数 CvTermCriteria criteria; criteria = cvTermCriteria(CV_TERMCRIT_EPS, , FLT_EPSILON); param = CvSVMParams(CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria); svm.train(trainData, trainClasses, NULL, NULL, param);//训练数据 //保存训练好的分类器 svm.save("HOG_SVM_DATA.xml"); cvReleaseMat(&trainData); cvReleaseMat(&trainClasses); }
opencv 手写选择题阅卷 (三)训练分类器的更多相关文章
- opencv 手写选择题阅卷 (二)字符识别
opencv 手写选择题阅卷 (二)字符识别 选择题基本上只需要识别ABCD和空五个内容,理论上应该识别率比较高的,识别代码参考了网上搜索的代码,因为参考的网址比较多,现在也弄不清是参考何处的代码了, ...
- opencv 手写选择题阅卷 (四)Android端 手机应用开发
opencv 手写选择题阅卷 (四)Android 手机应用开发 在PC端把代码调通以后开始开发Android 手机应用,因为主要功能代码为C++代码,所以需要通过NDK编译,JAVA通过JNI方式调 ...
- opencv 手写选择题阅卷 (一)表格设计与识别
(一)答题表格设计与识别 实际设计好的表格如下图 为了图像精确,表格和四角的标记都是由程序生成的,文字和数据是后期排版软件添加上去的. 图中四角的四个黑方块主要用来定位表格,然后就可以切割出每个单元格 ...
- TensorFlow 入门之手写识别CNN 三
TensorFlow 入门之手写识别CNN 三 MNIST 卷积神经网络 Fly 多层卷积网络 多层卷积网络的基本理论 构建一个多层卷积网络 权值初始化 卷积和池化 第一层卷积 第二层卷积 密集层连接 ...
- 利用opencv源代码和vs编程序训练分类器haartraining.cpp
如需转载请注明本博网址:http://blog.csdn.net/ding977921830/article/details/47733363. 一 训练框架 训练人脸检測分类器须要三个步骤: (1 ...
- OpenCV手写数字字符识别(基于k近邻算法)
摘要 本程序主要参照论文,<基于OpenCV的脱机手写字符识别技术>实现了,对于手写阿拉伯数字的识别工作.识别工作分为三大步骤:预处理,特征提取,分类识别.预处理过程主要找到图像的ROI部 ...
- 利用keras进行手写数字识别模型训练,并输出训练准确度
from keras.datasets import mnist (train_images, train_labels), (test_images, test_labels) = mnist.lo ...
- keras实现mnist手写数字数据集的训练
网络:两层卷积,两层全连接,一层softmax 代码: import numpy as np from keras.utils import to_categorical from keras imp ...
- MNIST手写数字数据库
手写数字库很容易建立,但是总会很浪费时间.Google实验室的Corinna Cortes和纽约大学柯朗研究所的Yann LeCun建有一个手写数字数据库,训练库有60,000张手写数字图像,测试库有 ...
随机推荐
- TC SRM 663 div2 B AABB 逆推
AABB Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 TC Description One day, Jamie noticed that many En ...
- goldengate的HANDLECOLLISIONS参数
HANDLECOLLISIONS 是一个 replicat 进程参数,主要在 initial load 中使用. 在 replicat 进程中使用该参数时,即使目标数据库环境中存在数据完整性问题(如 ...
- Github上最全的APICloud开源前端框架效果盘点(转)
1.微信网站几分钟变身“原生 App” 微信推出了微信JS-SDK,使微信公共号可以直接调用微信原生的接口,具备部分原生应用的能力.微信JS-SDK的推出,将大大提高微信公共号的 用户体验,但是如果存 ...
- Metadata Lock原理2
同事说开发机更改一个表结构,加字段,但是一直挂在那里,没反应.一开始以为表测试数据量很大,因为mysql增加表字段会重写表,后来看了下数据量很小,就另外查看过程.原因分析和处理如下: 一.环境 m ...
- 实例源码--Android小工具源码
下载源码 技术要点: 1. Android控件布局的使用 2. Http通信 3. XML数据解析 4. 网络状态的监听 5. 源码带有非常详细的中文注释 ...... 详细介绍: 1. An ...
- 用VB操作Excel的方法
VB是常用的应用软件开发工具之一,由于VB的报表功能有限,而且一但报表格式发生变化,就得相应修改程序,给应用软件的维护工作带来极大的不便.因此有很多程序员现在已经充分利用EXECL的强大报表功来实现报 ...
- Jessica's Reading Problem
Description Jessica's a very lovely girl wooed by lots of boys. Recently she has a problem. The fina ...
- 《JavaScript学习指南》第2版 学习笔记1
1.<noscript> 标签 noscript 元素用来定义在脚本未被执行时的替代内容(文本). 注释:如果浏览器支持脚本,那么它不会显示出 noscript 元素中的文本.无法识别 & ...
- 移动互联网(APP)产品设计的经验分享【转】
随着移动互联网的发展,越来越多的Web产品开始布局移动端,因此最近经常碰到PM们在交流讨论移动APP产品的设计.我从事移动互联网已经有一年多了,通过不断的学习和实践也积累了一些心得,今天整理并分享一下 ...
- mongoDB 用java连接
(1)下载连接java 的驱动包mongo-2.10.1.jar 下载网址 https://github.com/mongodb/mongo-java-driver/downloads (2)导入下载 ...