SSD 单发多框检测

其实现在用的最多的是faster rcnn，等下再弄项目~~~

图像经过基础网络块，三个减半模块，每个减半模块由两个二维卷积层，加一个maxPool减半（通道数依次增加【16,32,64】）
然后是多个（3个）多尺度特征块。每个特征块依次都是一个减半模块，通道数固定128
最后一个全局最大池化层模块，高宽降到1
注意，每次添加一个模块，后面都有两个预测层，一个类比预测层，一个边框预测层。类别预测层是一个二维卷积层，卷积层通道数是锚框*(类别+1) ，然后用不改变图像大小的卷积核3*3 ,padding = 1；边框预测层类似，通道数改为锚框 * 4

%matplotlib inline

import gluonbook as gb

from mxnet import autograd,gluon,image,init,nd,contrib

from mxnet.gluon import loss as gloss,nn

import time

# 类别预测层

def cls_predictor(num_anchors,num_classes):

    return nn.Conv2D(num_anchors*(num_classes+1),kernel_size=3,padding=1)

# 边框预测层

def bbox_predictor(num_anchors):

    return nn.Conv2D(num_anchors*4,kernel_size=3,padding=1)

# 连结多尺度

def forward(x,block):

    block.initialize()

    return block(x)

Y1 = forward(nd.zeros((2,8,20,20)),cls_predictor(5,10))

Y2 = forward(nd.zeros((2,16,10,10)),cls_predictor(3,10))

Y1.shape,Y2.shape

def flatten_pred(pred):

    return pred.transpose((0,2,3,1)).flatten()

def concat_preds(preds):

    return nd.concat(*[flatten_pred(p) for p in preds],dim=1)

concat_preds([Y1,Y2]).shape

# 减半模块

def down_sample_blk(num_channels):

    blk = nn.Sequential()

    for _ in range(2):

        blk.add(nn.Conv2D(num_channels,kernel_size=3,padding=1),

               nn.BatchNorm(in_channels=num_channels),

               nn.Activation('relu'))

    blk.add(nn.MaxPool2D(2))

    return blk

blk = down_sample_blk(10)

blk.initialize()

x = nd.zeros((2,3,20,20))

y = blk(x)

y.shape

# 主体网络块

def base_net():

    blk = nn.Sequential()

    for num_filters in [16,32,64]:

        blk.add(down_sample_blk(num_filters))

    return blk

bnet = base_net()

bnet.initialize()

x = nd.random.uniform(shape=(2,3,256,256))

y = bnet(x)

y.shape

# 完整的模型

def get_blk(i):

    if i==0:              # 0 基础网络模块

        blk = base_net()

    elif i==4:            #  4 全局最大池化层模块，将高宽降到1

        blk = nn.GlobalMaxPool2D()

    else:                 # 1 ,2 ,3 高宽减半模块

        blk = down_sample_blk(128)

    return blk

def blk_forward(X,blk,size,ratio,cls_predictor,bbox_predictor):

    Y = blk(X)

    anchors = contrib.nd.MultiBoxPrior(Y,sizes=size,ratios=ratio)

    cls_preds = cls_predictor(Y)

    bbox_preds = bbox_predictor(Y)

    return (Y, anchors, cls_preds,bbox_preds)

sizes = [[0.2, 0.272], [0.37, 0.447], [0.54, 0.619], [0.71, 0.79],

         [0.88, 0.961]]

ratios = [[1, 2, 0.5]] * 5

num_anchors = len(sizes[0]) + len(ratios[0]) - 1

# 完整的TinySSD

class TinySSD(nn.Block):

    def __init__(self, num_classes, **kwargs):

        super(TinySSD, self).__init__(**kwargs)

        self.num_classes = num_classes

        for i in range(5):

            # 赋值语句 self.blk_i = get_blk(i)

            setattr(self, 'blk_%d' % i,get_blk(i))

            setattr(self, 'cls_%d' % i,cls_predictor(num_anchors,num_classes))

            setattr(self, 'bbox_%d' % i,bbox_predictor(num_anchors))

    def forward(self, X):

        anchors, cls_preds, bbox_preds = [None]*5,[None]*5,[None]*5

        for i in range(5):

            # getattr(self, 'blk_%d' % i ) 即访问 self.blk_i

            X, anchors[i], cls_preds[i], bbox_preds[i] = blk_forward(

                X, getattr(self, 'blk_%d' % i), sizes[i], ratios[i],

                getattr(self, 'cls_%d' % i), getattr(self, 'bbox_%d' % i))

        return (nd.concat(*anchors, dim=1),

                concat_preds(cls_preds).reshape(

                    (0, -1, self.num_classes + 1)), concat_preds(bbox_preds))

# 测试形状

net = TinySSD(num_classes=1)

net.initialize()

X = nd.zeros((32,3,256,256))

anchors, cls_preds, bbox_preds = net(X)

print('output anchors:',anchors.shape)

print('output class preds:',cls_preds.shape)

print('output bbox preds:',bbox_preds.shape)

SSD 单发多框检测的更多相关文章

R-CNN,SPP-NET, Fast-R-CNN,Faster-R-CNN, YOLO, SSD系列深度学习检测方法梳理
1. R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation 技术路线:selec ...
【Android】不弹root请求框检测手机是否root
由于项目需要root安装软件,并且希望在合适的时候引导用户去开启root安装,故需要检测手机是否root. 最基本的判断如下,直接运行一个底层命令.(参考https://github.com/Trin ...
SSD回归类物体检测
本宝宝最近心情不会,反正这篇也是搬用别人博客的了:(SSD就是YOLO+anchor(不同feature map 作为input)) 引言这篇文章是在YOLO[1]之后的一篇文章,这篇文章目前是一篇 ...
基于深度学习的目标检测算法：SSD——常见的目标检测算法
from:https://blog.csdn.net/u013989576/article/details/73439202 问题引入: 目前,常见的目标检测算法,如Faster R-CNN,存在着速 ...
linux下ssd电子盘速度检测
代码: #include<stdio.h> #include<sys/time.h> #include <fcntl.h> #include <pthread ...
angularJS select下拉框检测改变
html:(已引入amazeUI) <div style="width:70px;display:inline-block;"> <form class=&quo ...
动手创建 SSD 目标检测框架
参考:单发多框检测(SSD) 本文代码被我放置在 Github:https://github.com/XinetAI/CVX/blob/master/app/gluoncvx/ssd.py 关于 SS ...
目标检测--SSD: Single Shot MultiBox Detector(2015)
SSD: Single Shot MultiBox Detector 作者: Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, ...
『TensorFlow』SSD源码学习_其三：锚框生成
Fork版本项目地址:SSD 上一节中我们定义了vgg_300的网络结构,实际使用中还需要匹配SSD另一关键组件:被选取特征层的搜索网格.在项目中,vgg_300网络和网格生成都被统一进一个class ...

随机推荐

no jpeg in java.library.path;java.lang.NoClassDefFoundError: Could not initialize class sun.awt.image.codec.JPEGImageEncoderImpl
no jpeg in java.library.path;java.lang.NoClassDefFoundError: Could not initialize class sun.awt.imag ...
chmod修改文件的权限/chown修改文件和目录的所有者（转）
ll指令的显示的信息为(当前目录下只有nameservice1一个目录): drwxr-xr-x 3 hdfs hdfs 4096 4月 14 16:19 nameservice1 上述信息分别表示: ...
Magento 2中文手册教程 - Magento 2 安装流程图
下图提供了安装Magento 2的安装流程概述: 设置你的服务器环境. 安装magento 2 必备软件, PHP, Apache, MySQL. 系统需求详细信息: 2.1.x 系统需求获得mag ...
如何查找消耗资源较大的SQL
对于优化来讲,查找消耗资源较大的SQL至关重要,下面介绍几个之前用到的SQL. 1.从V$SQLAREA中查询最占用资源的查询. select b.username username,a.disk_r ...
tomcat绑定域名绑定端口及更换ROOT目录
一.更换ROOT目录 tomcat默认网站目录为 webapps/ROOT ,那么我们如何改为自己的网站目录呢? 1.打开并编辑tomcat目录下的 conf/server.xml 大约在148行的位 ...
Spring学习（一） IoC
文章部分图片来自参考资料,本文介绍的是 Spring 的两个重要概念,是学习总结. 我们依旧提出几个问题,帮助我们在学习中带着问题解答. 问题 : 如何理解Ioc,它解决了什么难题(或者说是使用它 ...
Ruby 踩坑 “Failed to build gem native extension”
ruby新手,总是会出现这样那样的问题,这里先记录下,希望能解决你得问题. 首先是安装ruby 环境,楼主愚钝,在公司和自己的电脑上来来回回整了好几天,每次安装 gem 包的时候总是报错,错误信息大致 ...
从ExtensionLoader理解Dubbo扩展机制
Dubbo的扩展机制是怎么实现的?最简单的回答就是@SPI. Dubbo的插件化思路来源于Java SPI. JAVA SPI 机制 SPI的全名为Service Provider Int ...
Excel删除空白行和列
Sub DeleteEmptyRows() Dim LastRow As Long, r As Long LastRow = ActiveSheet.UsedRange.Rows.Count Last ...
禁用F12和鼠标右键，防止查看控制台代码
虽然是个治标不治本的办法,还是挺有用的(对Opera无效,Opera开始控制台是Ctrl+Shift+C) 在禁用同时,自身的代码健壮性也需要加强 // 屏蔽F12 document.onkeydow ...

SSD 单发多框检测

SSD 单发多框检测的更多相关文章

随机推荐

热门专题