目录 从零开始实现SSD目标检测(pytorch) 第一章 相关概念概述 1.1 检测框表示 1.2 交并比 第二章 基础网络 2.1 基础网络 2.2 附加网络 第三章 先验框设计 3.1 引言 3.2 先验框设计 3.3 先验框可视化 3.4 学习参数定义 第四章 网络输出定义 第五章 LOSS设计 5.1 目标框匹配 5.2 LOSS计算 第六章 非极大值抑制 从零开始实现SSD目标检测(pytorch) 特别说明: 本系列文章是Pytorch目标检测手册的翻译+总结 知其然知其所以然,光…
TF项目实战(SSD目标检测)-VOC2007 训练好的模型和代码会公布在网上: 步骤: 1.代码地址:https://github.com/balancap/SSD-Tensorflow 2.解压ssd_300_vgg.ckpt.zip 到checkpoint文件夹下(另外将vgg16模型放在本路径下) 3.测试一下看看,在notebooks文件夹下创建demo_test.py,其实就是复制ssd_notebook.ipynb中的代码,该py文件是完成对于单张图片的测试. import os…
前言 SSD 的全称是 Single Shot MultiBox Detector,它和 YOLO 一样,是 One-Stage 目标检测算法中的一种.由于是单阶段的算法,不需要产生所谓的候选区域,所以 SSD 可以达到很高的帧率,同时 SSD 中使用了多尺度的特征图来预测目标,所以 mAP 可以比肩甚至超过 Faster R-CNN.在这篇博客中,我们会详细地介绍 SSD 的原理,并使用 pytorch 来实现 SSD. 模型结构 VGG16 SSD 的结构如上图所示,可以看到 SSD 使用…
Single Shot multibox Detector,简称SSD,是一种目标检测算法. Single Shot意味着SSD属于one stage方法,multibox表示多框预测. CNN 多尺度 特征图 参考链接: https://arxiv.org/pdf/1711.06897.pdf…
参考:单发多框检测(SSD) 本文代码被我放置在 Github:https://github.com/XinetAI/CVX/blob/master/app/gluoncvx/ssd.py 关于 SSD 的训练见:https://github.com/XinetAI/CVX/blob/master/目标检测/训练SSD.ipynb 虽然李沐大神的教程关于 SSD 的讲解很不错,但是大都是函数式的编程,本文我将 SSD 的几个基本组件进行封装,使得 SSD 可以像堆积木一样来进行组织.基网络你可以…
一.任务 现在用caffe做目标检测一般需要lmdb格式的数据,而目标检测的数据和目标分类的lmdb格式的制作难度不同.就目标检测来说,例如准备SSD需要的数据,一般需要以下几步: 1.准备图片并标注groundtruth        2.将图像和txt格式的gt转为VOC格式数据        3.将VOC格式数据转为lmdb格式数据 本文的重点在第2.3步,第一步标注任务用小代码实现即可.网络上大家制作数据格式一般是仿VOC0712的,建立各种目录,很麻烦还容易出错,现我整理了一下代码,只…
SSD实战——人脸检测 Tensorflow 一 .人脸检测的困难: 1. 姿态问题 2.不同种族人, 3.光照 遮挡 带眼睛 4.视角不同 5. 不同尺度 二. 数据集介绍以及转化VOC: 1. FDDB 2.WIDER Face (本实战采用) 3.MegaFace WIDER Face介绍: 本数据集为香港中文大学的数据集,33203个图像 和 393703个人脸图像 划分 40%训练  10%交叉验证  50%测试 链接https://pan.baidu.com/s/1tE3HHbRaW…
本来SSD做测试的Python接口用起来也是比较方便的,但是如果部署集成的话,肯定要用c++环境,于是动手鼓捣了一下. 编译用的cmake,写的CMakeList.txt,期间碰到一些小问题,简单记录一下问题以及解决方法. 当然前提是你本地的caffe环境没啥问题.各种依赖都安好了.. 1.error: ‘AnnotatedDatum’ has not been declared    AnnotatedDatum* anno_datum); /home/jiawenhao/ssd/caffe/…
数据转化为VOC格式: 一.我们先看 VOC格式的数据是什么??? Annotations:存放xml 包括 文件夹信息   图片名称. 图片尺寸信息. 图片中object的信息. JPEGImages: 存放图片 二.分析Wider FACE数据集: 数据集中的txt中信息为:第一行: 图片路径第二行:多少个人脸第三行:bbox信息 存储的左上角 坐标 和 高度宽度 三.代码转换: import os,cv2,sys,shutil from xml.dom.minidom import Doc…
slides 讲得是相当清楚了: http://www.cs.unc.edu/~wliu/papers/ssd_eccv2016_slide.pdf 配合中文翻译来看: https://www.cnblogs.com/cx2016/p/11385009.html default boxes 核心点讲解 及 .cpp 代码见:https://www.cnblogs.com/sddai/p/10206929.html 小哥的后续论文: PUBLICATIONS Frustum PointNets f…