结合上升采样upsample和卷积操作.Sub-piexl convolution. Efficient Sub-pixel-convolutional-layers. LR network,即低分辨卷积网络.在upsample的过程中对图像就进行了卷积. HR network,高分辨卷积网络,一般HR network是现将低分辨力的图像进行二次插值变换后然后对变换后的图像再进行卷积网络.像HR network是先将图像进行upsample后才进行卷积. 得到r^2个通道特征图然后通过周期筛选(…
Faster R-CNN在Fast R-CNN的基础上的改进就是不再使用选择性搜索方法来提取框,效率慢,而是使用RPN网络来取代选择性搜索方法,不仅提高了速度,精确度也更高了 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 依靠于区域推荐算法(region proposal algorithms)去假定目标位置的最优的目标检测网络.之前的工作如SPPnet和Fast RCNN都减少了检测…
<Explaining and harnessing adversarial examples> 论文学习报告 组员:裴建新   赖妍菱    周子玉 2020-03-27 1 背景 Szegedy有一个有趣的发现:有几种机器学习模型,包括最先进的神经网络,很容易遇到对抗性的例子.所谓的对抗性样例就是对数据集中的数据添加一个很小的扰动而形成的输入.在许多情况下,在训练数据的不同子集上训练不同体系结构的各种各样的模型错误地分类了相同的对抗性示例.这表明,对抗性例子暴露了我们训练算法中的基本盲点.…
A³CLNN: Spatial, Spectral and Multiscale Attention ConvLSTM Neural Network for Multisource Remote Sensing Data Classification 有效利用信息多个数据源的问题已成为遥感领域一个相关但具有挑战性的研究课题.在本文中,我们提出了一种新的方法来利用两个数据源的互补性:高光谱图像(HSI)和光检测与测距(LiDAR)数据.具体来说,我们开发了一种新的双通道空间,频谱和多尺度注意力卷积…
特别声明:本文来源于掘金,"预留"发表的[Apache Calcite 论文学习笔记](https://juejin.im/post/5d2ed6a96fb9a07eea32a6ff) 最近在关注大数据处理的技术和开源产品的实现,发现很多项目中都提到了一个叫 Apache Calcite 的东西.同样的东西一两次见不足为奇,可再三被数据处理领域的各个不同时期的产品提到就必须引起注意了.为此也搜了些资料,关于这个东西的介绍2018 年发表在 SIGMOD 的一篇论文我觉得是拿来入门最合适…
相关论文:Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks 概论 用于人脸检测和对齐. 本文提出的unified cascaded CNNs by multi-task learning,包含三个阶段: 1) 利用一个浅层的CNN快速产生候选窗口 2) 利用一个更复杂的CNN排除掉大量非人脸窗口 3) 利用一个更强大的CNN进一步改善结果,并输出人脸关键点位置. 本文的贡献: 1…
关于triplet loss的原理.目标函数和梯度推导在上一篇博客中已经讲过了.详细见:triplet loss原理以及梯度推导.这篇博文主要是讲caffe下实现triplet loss.编程菜鸟.假设有写的不优化的地方,欢迎指出. 1.怎样在caffe中添加新的layer 新版的caffe中添加新的layer.变得轻松多了.概括说来.分四步: 1)在./src/caffe/proto/caffe.proto 中添加 相应layer的paramter message. 2)在./include/…
报错: Failed to find layer (XXX/XXX.xxActivity#0) in layer parent (no-parent). 解决: 将该xxActivity复制一份到桌面,然后删除该xxActivity,最后粘贴回项目原位置.…
SSD: Single Shot MultiBox Detector——目标检测 参考https://blog.csdn.net/u010167269/article/details/52563573 目标检测算法可分为两种类型:one-stage和two-stage,两者的区别在于前者是直接基于网络提取到的特征和预定义的框(anchor)进行目标预测:后者是先通过网络提取到的特征和预定义的框学习得到候选框(region of interest,RoI),然后基于候选框的特征进行目标检测 one…
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 深度神经网络中用于视觉识别的空间金字塔池化 1.INTRODUCTION 一般的深度神经网络都会设定一个固定的输入图片大小,比如 224*224,因此一般在数据处理时我们会将输入的数据进行裁剪或按比例缩放,在这种情况下就会导致输入的图片出现目标内容缺失或者是目标内容发生形变,即尺度误差或者形变误差,导致检测精确度的下降 所以提出了一种带着另一…