Faster R-CNN由一个推荐区域的全卷积网络和Fast R-CNN组成, Fast R-CNN使用推荐区域.整个网络的结构如下: 1.1 区域推荐网络 输入是一张图片(任意大小), 输出是目标推荐矩形框的集合,以及相应的目标打分.网络的前面使用了一个基本的卷积层集合来提取特征(ZF或VGG-16).这个基本层同时被RPN网络和Fast R-CNN使用. 在基本层之后,文中使用一个n*n的滑动窗口在最后一层特征图卷积,在每一个窗口位置,得到一个256维或512维的特征.这个特征随后被送进两个…