SSD目标检测实战（TF项目）—

数据转化为VOC格式：

一、我们先看 VOC格式的数据是什么？？？

Annotations：存放xml  包括 文件夹信息   图片名称、 图片尺寸信息、 图片中object的信息。

JPEGImages：   存放图片
 
二、分析Wider FACE数据集：
 
数据集中的txt中信息为：
第一行： 图片路径
第二行：多少个人脸
第三行：bbox信息   存储的左上角 坐标 和 高度宽度

三、代码转换：

 import os,cv2,sys,shutil
 
 from xml.dom.minidom import Document
 
 def writexml(filename,saveimg,bboxes,xmlpath,typename):
     #xml打包的函数，我们不需要知道内部做了什么。
     #我们只需要将图片名称   图片信息   bbox信息    最终存储信息 作为参数 就可以了
     #不需要做修改
 
     doc = Document()                                #定义文件对象
     annotation = doc.createElement('annotation')  #创建根节点
     doc.appendChild(annotation)    #存放在doc中
     # 定义annotation 的子节点
     folder = doc.createElement('folder')
 
     folder_name = doc.createTextNode('widerface')
     folder.appendChild(folder_name)
     annotation.appendChild(folder)
     filenamenode = doc.createElement('filename')
     filename_name = doc.createTextNode(filename)
     filenamenode.appendChild(filename_name)
     annotation.appendChild(filenamenode)
     source = doc.createElement('source')
     annotation.appendChild(source)
     database = doc.createElement('database')
     database.appendChild(doc.createTextNode('wider face Database'))
     source.appendChild(database)
     annotation_s = doc.createElement('annotation')
     annotation_s.appendChild(doc.createTextNode('PASCAL VOC2007'))
     source.appendChild(annotation_s)
     image = doc.createElement('image')
     image.appendChild(doc.createTextNode('flickr'))
     source.appendChild(image)
     flickrid = doc.createElement('flickrid')
     flickrid.appendChild(doc.createTextNode('-1'))
     source.appendChild(flickrid)
     owner = doc.createElement('owner')
     annotation.appendChild(owner)
     flickrid_o = doc.createElement('flickrid')
     flickrid_o.appendChild(doc.createTextNode('yanyu'))
     owner.appendChild(flickrid_o)
     name_o = doc.createElement('name')
     name_o.appendChild(doc.createTextNode('yanyu'))
     owner.appendChild(name_o)
 
     size = doc.createElement('size')
     annotation.appendChild(size)
 
     width = doc.createElement('width')
     width.appendChild(doc.createTextNode(str(saveimg.shape[1])))
     height = doc.createElement('height')
     height.appendChild(doc.createTextNode(str(saveimg.shape[0])))
     depth = doc.createElement('depth')
     depth.appendChild(doc.createTextNode(str(saveimg.shape[2])))
 
     size.appendChild(width)
 
     size.appendChild(height)
     size.appendChild(depth)
     segmented = doc.createElement('segmented')
     segmented.appendChild(doc.createTextNode(''))
     annotation.appendChild(segmented)
     for i in range(len(bboxes)):
         bbox = bboxes[i]
         objects = doc.createElement('object')
         annotation.appendChild(objects)
         object_name = doc.createElement('name')
         object_name.appendChild(doc.createTextNode(typename[i]))  #人脸数据的话 直接为 “face”
         objects.appendChild(object_name)
         pose = doc.createElement('pose')
         pose.appendChild(doc.createTextNode('Unspecified'))
         objects.appendChild(pose)
         truncated = doc.createElement('truncated')
         truncated.appendChild(doc.createTextNode(''))
         objects.appendChild(truncated)
         difficult = doc.createElement('difficult')
         difficult.appendChild(doc.createTextNode(''))
         objects.appendChild(difficult)
         bndbox = doc.createElement('bndbox')
         objects.appendChild(bndbox)
         xmin = doc.createElement('xmin')
         xmin.appendChild(doc.createTextNode(str(bbox[0])))
         bndbox.appendChild(xmin)
         ymin = doc.createElement('ymin')
         ymin.appendChild(doc.createTextNode(str(bbox[1])))
         bndbox.appendChild(ymin)
         xmax = doc.createElement('xmax')
         xmax.appendChild(doc.createTextNode(str(bbox[2])))#  bbox[0] +
         bndbox.appendChild(xmax)
         ymax = doc.createElement('ymax')
         ymax.appendChild(doc.createTextNode(str(bbox[3])))#  bbox[1] +
         bndbox.appendChild(ymax)
     f = open(xmlpath, "w")
     f.write(doc.toprettyxml(indent=''))
     f.close()
 
 rootdir = "/media/kuan/新加卷/wider_face"  #定义数据集的根目录wider_face  下载好的
 
 def convertimgset(img_set):  #解析函数 img_set 作为解析的路径    img_sets = ["train","val"]
     imgdir = rootdir + "/WIDER_" + img_set + "/images"                                   #图片文件的路径
     gtfilepath = rootdir + "/wider_face_split/wider_face_" + img_set + "_bbx_gt.txt"  #标注信息
     fwrite = open(rootdir + "/ImageSets/Main/" + img_set + ".txt", 'w')  #写入txt中 main 底下的文件夹 对应140行
     index = 0    #表示解析到第几张图
     with open(gtfilepath, 'r') as gtfiles:      #打开真值文件，获取bbox
         while(True):                            #true   index< 1000 #前1000个样本
             filename = gtfiles.readline()[:-1]         #读取一行数据， 为图像路径
             if filename == None or filename == "":
                 break
             imgpath = imgdir + "/" + filename         #图片的绝对路径
             img = cv2.imread(imgpath)                 #拿到读取图片   可以获取到shape信息
             if not img.data:
                 break;
             numbbox = int(gtfiles.readline())         #读取到了第二行    人脸个数
             bboxes = []
             print(numbbox)
             for i in range(numbbox):                 #读取bbox信息  numbbox 行
                 line = gtfiles.readline()
                 lines = line.split(" ")
                 lines = lines[0:4]
 
                 bbox = (int(lines[0]), int(lines[1]), int(lines[2]), int(lines[3]))  #存储的左上角 坐标 和 高度宽度
 
                 if int(lines[2]) < 40 or int(lines[3]) < 40:
                     continue
 
                 bboxes.append(bbox)             #存放到bbox中   numbbox个人脸信息
 
                 #cv2.rectangle(img, (bbox[0],bbox[1]),(bbox[0]+bbox[2],bbox[1]+bbox[3]),color=(255,255,0),thickness=1)
 
             filename = filename.replace("/", "_")    #图片的名称存储
 
             if len(bboxes) == 0:
                 print("no face")
                 continue
             #cv2.imshow("img", img)
             #cv2.waitKey(0)
             cv2.imwrite("{}/JPEGImages/{}".format(rootdir,filename), img)  #写入图像JPEGImages
             fwrite.write(filename.split(".")[0] + "\n")     #写入txt中 main 底下的文件夹
             xmlpath = "{}/Annotations/{}.xml".format(rootdir,filename.split(".")[0])
             writexml(filename, img, bboxes, xmlpath)   #调用函数
             print("success number is ", index)
             index += 1
 
     fwrite.close()
 
 if __name__=="__main__":
     img_sets = ["train","val"]
     for img_set in img_sets:
         convertimgset(img_set)
     #修改文件名
     shutil.move(rootdir + "/ImageSets/Main/" + "train.txt", rootdir + "/ImageSets/Main/" + "trainval.txt")
     shutil.move(rootdir + "/ImageSets/Main/" + "val.txt", rootdir + "/ImageSets/Main/" + "test.txt")

通过上面三个步骤我们就生成了VOC格式的数据集，现在我们只需要放到工程目录下并且进行修改就可以开始训练了。

详细修改方法见下：

https://www.cnblogs.com/WSX1994/p/11216953.html

SSD目标检测实战（TF项目）——人脸检测2的更多相关文章

人脸检测学习笔记（数据集-DLIB人脸检测原理-DLIB&OpenCV人脸检测方法及对比）
1.Easily Create High Quality Object Detectors with Deep Learning 2016/10/11 http://blog.dlib.net/201 ...
TF项目实战（基于SSD目标检测）——人脸检测1
SSD实战——人脸检测 Tensorflow 一 .人脸检测的困难: 1. 姿态问题 2.不同种族人, 3.光照遮挡带眼睛 4.视角不同 5. 不同尺度二. 数据集介绍以及转化VOC: 1. F ...
基于MATLAB的adaboost级联形式的人脸检测实现
很早之前就做过一些关于人脸检测和目标检测的课题,一直都没有好好总结出来,趁着这个机会,写个总结,希望所写的内容能给研究同类问题的博友一些见解和启发!!博客里面涉及的公式太繁琐了,直接截图了. 转载请注 ...
Android 中使用 dlib+opencv 实现动态人脸检测
1 概述完成 Android 相机预览功能以后,在此基础上我使用 dlib 与 opencv 库做了一个关于人脸检测的 demo.该 demo 在相机预览过程中对人脸进行实时检测,并将检测到的人脸用 ...
OpenCV 学习笔记 05 人脸检测和识别
本节将介绍 Haar 级联分类器,通过对比分析相邻图像区域来判断给定图像或子图像与已知对象是否匹配. 本章将考虑如何将多个 Haar 级联分类器构成一个层次结构,即一个分类器能识别整体区域(如人脸) ...
Android Camera2 预览，拍照，人脸检测并实时展现
https://www.jianshu.com/p/5414ba2b5508 背景最近需要做一个人脸检测并实时预览的功能.就是边检测人脸,边在预览界面上框出来. 当然本人并不是专门做 ...
paper 90：人脸检测研究2015最新进展
搜集整理了2004~2015性能最好的人脸检测的部分资料,欢迎交流和补充相关资料. 1:人脸检测性能 1.1 人脸检测测评目前有两个比较大的人脸测评网站: 1:Face Detection Data ...
用caffe一步一步实现人脸检测
学习深度学习已有一段时间了,总想着拿它做点什么,今天终于完成了一个基于caffe的人脸检测,这篇博文将告诉你怎样通过caffe一步步实现人脸检测.本文主要参考唐宇迪老师的教程,在这里感谢老师的辛勤付出 ...
OpenCV神技——人脸检测，猫脸检测
简介 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux.Windows.Android和Mac OS操作系统上.它轻量级而且高效--由一系列 C 函数和少量 ...
机器学习: Viola-Jones 人脸检测算法解析(一)
在计算机视觉领域中,人脸检测或者物体检测一直是一个非常受关注的领域,而在人脸检测中,Viola-Jones人脸检测算法可以说是非常经典的一个算法,所有从事人脸检测研究的人,都会熟悉了解这个算法,Vio ...

随机推荐

Codeforces 940 E.Cashback (单调队列，dp）
Codeforces 940 E.Cashback 题意:一组数,要分为若干个区间,每个区间长度为ki(1<=ki<=n),并且对于每个区间删去前ki/c(向下取整)个小的数(即对区间升序 ...
mysql: error while loading shared libraries: libnuma.so
安装mysql后,执行初始化配置脚本,创建系统自带的数据库和表时报异常: [root@VM_0_12_centos mysql]# scripts/mysql_install_db --basedir ...
JS基础_call和apply
call()和apply() - 这两个方法都是函数对象的方法,需要通过函数对象来调用 - 当对函数调用call()和apply()都会调用函数执行 - 在调用call和apply可以将一个对象指定为 ...
LeetCode 复原IP地址（探索字节跳动）
题目描述给定一个只包含数字的字符串,复原它并返回所有可能的 IP 地址格式. 示例: 输入: "25525511135" 输出: ["255.255.11.135&qu ...
springboot发送邮件，以及携带邮件附件简单使用
可以通过springboot官方文档中Sending Email,找到类似如下java mail的使用文档 https://docs.spring.io/spring/docs/5.1.9.RELEA ...
Centos7 部署.Net Core+Nginx+Supervisor
1.安装.Net Core SDK 1.1. 在安装.NET之前,您需要注册Microsoft密钥,注册产品存储库并安装所需的依赖项.这只需要每台机器完成一次. sudo rpm -Uvh https ...
快速解决设置Android 23.0以上版本对SD卡的读写权限无效的问题
快速解决设置Android 23.0以上版本对SD卡的读写权限无效的问题转 https://www.jb51.net/article/144939.htm 今天小编就为大家分享一篇快速解决设置And ...
react中回车enter事件处理
对于常见的搜索需求业务场景,用户输入完成后,点击enter事件请求数据,要求不提交页面,实现数据局部更新,这需要用到react中的表单Forms. 处理方法: (1)html书写 form标签中去掉a ...
使用Jsp +Js + Jquery + EasyUI + Servlet + Lucene，完成分页
步一:创建ArticleDao.java类 public class ArticleDao { public Integer getAllObjectNum(String keywords) thro ...
Intel64及IA-32架构优化指南第8章多核与超线程技术——8.9 其它共享资源的优化
8.9 其它共享资源的优化在多线程应用中的资源优化依赖于处理器拓扑层级内相关联的Cache拓扑以及执行资源.在第7章中讨论了处理器拓扑以及标识处理器拓扑的一种软件算法. 在带有共享总线的平台中,总线 ...

SSD目标检测实战（TF项目）——人脸检测2

SSD目标检测实战（TF项目）——人脸检测2的更多相关文章

随机推荐

热门专题