论文源址:https://arxiv.org/abs/1406.4729 tensorflow相关代码:https://github.com/peace195/sppnet 摘要 深度卷积网络需要输入固定尺寸大小的图片(224x224),这引入了大量的手工因素,同时,一定程度上,对于任意尺寸的图片或者子图会降低识别的准确率.SPP-net对于任意大小的图片,可以生成固定长度的特征表述.SPP-net对于变形的图片仍有一定的鲁棒性.基于上述优点,SPP-net会提高基于CNN的图像分类的效果. S…
论文源址:http://www.cs.berkeley.edu/~rbg/#girshick2014rcnn 摘要 在PASCAL VOC数据集上,最好的方法的思路是将低级信息与较高层次的上下文信息进行结合.该文的两个亮点:(1)将CNN应用到region proposals 用于对目标物体的定位.(2)对于较少数量的标签数据,先在规模较大的数据集上进行有监督的预训练,然后针对特定场景进行微调,发现性能提升的较大.R-CNN:region with CNN features 介绍 特征问题:视觉…
论文源址:https://arxiv.org/abs/1512.02325 tensorflow代码:https://github.com/balancap/SSD-Tensorflow 摘要 SSD也为单阶段的网络,在feature map的每个feature map像素上生成一系列不同尺寸与大小的默认框,预测时,网络输出的分数代表每个默认框中目标物的类别,同时,调整框的大小与目标物的外形更加匹配.针对不同尺寸大小的物体,网络结合不同的网络层(具有不同的分辨率)的预测值.相对于提取目标prop…
论文源址:https://arxiv.org/abs/1506.02640 tensorflow代码:https://github.com/nilboy/tensorflow-yolo 摘要 该文提出一种新的目标检测网络,yolo,以前的目标检测问题偏向于分类,而本文将目标检测看作是带有类别分数的回归问题.yolo从整张图上预测边界框和类别分数.是单阶段网络,可以进行端到端的训练.yolo处理速度十分迅速,每秒处理45帧图片.yolo在准确率上有待提升,但很少预测出假正的样例. 介绍 yolo的…
论文源址:https://arxiv.org/abs/1504.08083 参考博客:https://blog.csdn.net/shenxiaolu1984/article/details/51036677 摘要 该文提出了一个快速的基于区域框的卷积网络用于目标检测任务.Fast RCNN使用深度卷积网络对proposals进行分类.相比先前的工作,Fast R-CNN在提高准确率的基础上提高了训练和测试的速度.在VGG19的网络中,Fast R-CNN训练时间比R-CNN快9倍,而测试要快2…
论文源址:https://arxiv.org/abs/1605.09410 tensorflow 代码:https://github.com/renmengye/rec-attend-public 摘要 卷积网络在像语义分割等结构预测任务中效果较好,但对于场景中不同实例个体分割仍存在一定的挑战性.实例分割有很多应用场景,比如,自动驾驶,图像捕捉,智能视频问答系统等.将大量的图形模型与低层次的可视化信息相结合用于实例分割.该文提出了一个端到端的带有注意力机制的RNN结构,来进行精细的实例分割.该网…
源文网址:https://arxiv.org/abs/1707.03718 tensorflow代码:https://github.com/luofan18/linknet-tensorflow 基于Linknet的分割实验:https://github.com/fourmi1995/IronSegExperiment-LinkNet 摘要 像素级分割不仅准确率上有要求,同时需要应用的实际中实时的应用中.虽然精度上较高,但参数与操作上的数量都是十分巨大的.本文提出的网络结构参数并未增加.只使用了…
Introduction 该文章首次采用深度学习方法来解决基于视频的行人重识别,创新点:提出了一个新的循环神经网络架构(recurrent DNN architecture),通过使用Siamese网络(孪生神经网络),并结合了递归与外貌数据的时间池,来学习每个行人视频序列的特征表示. Method (1)特征提取架构: 第一层:卷积神经网络,提取每个行人的外貌特征向量: 第二层:循环神经网络,让网络更好的提取时空信息: 第三层:时间池,让网络将不同长度的视频序列总结为一个特征向量. Siame…
论文阅读笔记(十七)ICCV2017的扩刊(会议论文[传送门]) 改进部分: (1)惩罚函数:原本由两部分组成的惩罚函数,改为只包含 Sequence Cost 函数: (2)对重新权重改进: ① Positive Re-Weighting: 其中 若太大,则选择的样本标签的可信度小:若太小,则样本数量不足以进行矩阵学习,因此设置如下的: 其中,σ为 [0, 1],如果 σ = 1,则说明充分相信样本估计的可信度,反之设置为 σ = 0. ② Negative Re-Weighting: 对于所…
Introduction (1)Motivation: 大量标记数据成本过高,采用半监督的方式只标注一部分的行人,且采用单样本学习,每个行人只标注一个数据. (2)Method: 对没有标记的数据生成一个伪标签(pseudo labels),将标记的数据和部分伪标签的数据作为扩充数据集进行训练. 但这种方法引入了很多不可信的训练样本,制约了训练模型的性能. (3)Contribution: ① 为了在单样本学习中更好的利用未标签数据,提出了步进学习方法EUG(Exploit the Unknow…