VAE论文学习

intractable棘手的,难处理的 posterior distributions后验分布 directed probabilistic有向概率 approximate inference近似推理 multivariate Gaussian多元高斯 diagonal对角 maximum likelihood极大似然参考:https://blog.csdn.net/yao52119471/article/details/84893634 VAE论文所在讲的问题是: 我们现在就是想要训练…

Faster RCNN论文学习

Faster R-CNN在Fast R-CNN的基础上的改进就是不再使用选择性搜索方法来提取框,效率慢,而是使用RPN网络来取代选择性搜索方法,不仅提高了速度,精确度也更高了 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 依靠于区域推荐算法(region proposal algorithms)去假定目标位置的最优的目标检测网络.之前的工作如SPPnet和Fast RCNN都减少了检测…

《Explaining and harnessing adversarial examples》论文学习报告

<Explaining and harnessing adversarial examples> 论文学习报告组员:裴建新赖妍菱周子玉 2020-03-27 1 背景 Szegedy有一个有趣的发现:有几种机器学习模型,包括最先进的神经网络,很容易遇到对抗性的例子.所谓的对抗性样例就是对数据集中的数据添加一个很小的扰动而形成的输入.在许多情况下,在训练数据的不同子集上训练不同体系结构的各种各样的模型错误地分类了相同的对抗性示例.这表明,对抗性例子暴露了我们训练算法中的基本盲点.…

论文学习笔记 - 高光谱和 LiDAR 融合分类合集

A³CLNN: Spatial, Spectral and Multiscale Attention ConvLSTM Neural Network for Multisource Remote Sensing Data Classification 有效利用信息多个数据源的问题已成为遥感领域一个相关但具有挑战性的研究课题.在本文中,我们提出了一种新的方法来利用两个数据源的互补性:高光谱图像(HSI)和光检测与测距(LiDAR)数据.具体来说,我们开发了一种新的双通道空间,频谱和多尺度注意力卷积…

Apache Calcite 论文学习笔记

特别声明:本文来源于掘金,"预留"发表的[Apache Calcite 论文学习笔记](https://juejin.im/post/5d2ed6a96fb9a07eea32a6ff) 最近在关注大数据处理的技术和开源产品的实现,发现很多项目中都提到了一个叫 Apache Calcite 的东西.同样的东西一两次见不足为奇,可再三被数据处理领域的各个不同时期的产品提到就必须引起注意了.为此也搜了些资料,关于这个东西的介绍2018 年发表在 SIGMOD 的一篇论文我觉得是拿来入门最合适…

FactorVAE论文学习-1

Disentangling by Factorising 我们定义和解决了从变量的独立因素生成的数据的解耦表征的无监督学习问题.我们提出了FactorVAE方法,通过鼓励表征的分布因素化且在维度上独立来解耦.我们展示了其通过在解耦和重构质量之间提供一个更好的权衡(trade-off)来实现优于β-VAE的效果.而且我们着重强调了通常使用的解耦度量方法的问题,并引入一种不受这些问题影响的新度量方法. 1. Introduction 学习能够揭示数据语义意思的可解释(interpretable)表示…

GoogleNet：inceptionV3论文学习

Rethinking the Inception Architecture for Computer Vision 论文地址:https://arxiv.org/abs/1512.00567 Abstract 介绍了卷积网络在计算机视觉任务中state-of-the-art.分析现在现状,本文通过适当增加计算条件下,通过suitably factorized convolutions 和 aggressive regularization来扩大网络.并说明了取得的成果. 1. Introduct…

IEEE Trans 2008 Gradient Pursuits论文学习

之前所学习的论文中求解稀疏解的时候一般采用的都是最小二乘方法进行计算,为了降低计算复杂度和减少内存,这篇论文梯度追踪,属于贪婪算法中一种.主要为三种:梯度(gradient).共轭梯度(conjugate gradient).近似共轭梯度(an approximation to the conjugate gradient),看师兄之前做压缩感知的更新点就是使用近似共轭梯度方法代替了StOMP中的最小二乘的步骤. 首先说明一下论文中的符号表示: Γn表示第n次迭代过程中所选择的原子的索引 ΦΓn…

Raft论文学习笔记

先附上论文链接 https://pdos.csail.mit.edu/6.824/papers/raft-extended.pdf 最近在自学MIT的6.824分布式课程,找到两个比较好的github:MIT课程<Distributed Systems >学习和翻译和 https://github.com/chaozh/MIT-6.824-2017 6.824的Lab 2 就是实现Raft算法.Raft是一种分布式一致性算法,提供了和paxos相同的功能和性能,但比paxos要容易理解很多…

论文学习-系统评估卷积神经网络各项超参数设计的影响-Systematic evaluation of CNN advances on the ImageNet

博客:blog.shinelee.me | 博客园 | CSDN 写在前面论文状态:Published in CVIU Volume 161 Issue C, August 2017 论文地址:https://arxiv.org/abs/1606.02228 github地址:https://github.com/ducha-aiki/caffenet-benchmark 在这篇文章中,作者在ImageNet上做了大量实验,对比卷积神经网络架构中各项超参数选择的影响,对如何优化网络性能很有启发…

论文学习笔记--无缺陷样本产品表面缺陷检测 A Surface Defect Detection Method Based on Positive Samples

文章下载地址:A Surface Defect Detection Method Based on Positive Samples 第一部分论文中文翻译摘要:基于机器视觉的表面缺陷检测和分类可以大大提高工业生产的效率.利用足够的已标记图像,基于卷积神经网络的缺陷检测方法已经实现了现有技术的检测效果. 然而在实际应用中,缺陷样本或负样本通常难以预先收集,并且手动标记需要耗费大量时间.本文提出了一种仅基于正样本训练的新型缺陷检测框架. 其检测原理是建立一个重建网络,如果它们存在,可以修复样本…

DeepCTR专题：DeepFM论文学习和实现及感悟

论文地址:https://arxiv.org/pdf/1703.04247.pdf CTR预估我们知道在比较多的应用场景下都有使用.如:搜索排序.推荐系统等都有广泛的应用.并且CTR具有极其重要的地位,特别相对广告推荐领域来说更加如此,竞价广告需要通过ctr给出相应的价格,并由此获得广告曝光的机会.而ctr的大小决定了出价的高低,直接会影响到该广告是否能得到曝光机会.这里涉及到计算广告相关的知识,暂时就不展开讲了.这里主要介绍一下DeepFM该算法的基本原理和网络框架. 论文总体来看还是相对比…

DeepCTR专题：Neural Factorization Machines 论文学习和实现及感悟

papers地址:https://arxiv.org/pdf/1708.05027.pdf 借用论文开头,目前很多的算法任务都是需要使用category feature,而一般对于category feature处理的方式是经过one hot编码,然后我们有些情况下,category feature 对应取值较多时,如:ID等,one hot 编码后,数据会变得非常的稀疏,不仅给算法带来空间上的复杂度,算法收敛也存在一定的挑战. 为了能解决one hot 编码带来的数据稀疏性的问题,我们往往能想…

Lasso估计论文学习笔记(一)

最近课程作业让阅读了这篇经典的论文,写篇学习笔记. 主要是对论文前半部分Lasso思想的理解,后面实验以及参数估计部分没有怎么写,中间有错误希望能提醒一下,新手原谅一下. 1.整体思路作者提出了一种收缩和选择方法Lasso,这是一种可以用于线性回归的新的估计方法.它具有子集选择和岭回归的各自的优点.像子集选择一样可以给出具有解释力的模型,又能像岭回归一样具有可导的特性,比较稳定.同时避免了子集选择不可导,部分变化引起整体巨大变化这一不稳定的缺点.以及岭回归不能很好的收缩到0的缺点. 2.对文章…

BicycleGAN: Toward Multimodal Image-to-Image Translation - 1 - 论文学习，成对数据

Abstract 许多图像到图像的翻译问题是有歧义的,因为一个输入图像可能对应多个可能的输出.在这项工作中,我们的目标是在一个条件生成模型设置中建立可能的输出分布.将模糊度提取到一个低维潜在向量中,在测试时随机采样.生成器学习将给定的输入与此潜在编码映射到输出.我们明确地鼓励输出和潜在编码之间的连接是可逆的.这有助于防止训练期间从潜在编码到输出的多对一映射也称为模式崩溃问题,并产生更多样化的结果.我们通过使用不同的训练目标.网络架构和注入潜在编码的方法来探索此方法的几个变体.我们提出的方法鼓励了…

MUNIT：Multimodal Unsupervised Image-to-Image Translation - 1 - 论文学习，不成对数据

摘要:无监督图像转换是计算机视觉领域中一个重要而又具有挑战性的问题.给定源域中的一幅图像,目标是学习目标域中对应图像的条件分布,而不需要看到任何对应图像对的例子.虽然这种条件分布本质上是多模态的,但现有的方法做了过度简化的假设,将其建模为确定性的一对一映射.因此,它们无法从给定的源域映像生成不同的输出.为了解决这一局限性,我们提出了一个多模态无监督图像到图像的转换(MUNIT)框架.我们假设可以将图像表示分解为域不变的内容代码和捕获特定域属性的样式代码.为了将图像转换到另一个域,我们将其内容代码…

SAGAN:Self-Attention Generative Adversarial Networks - 1 - 论文学习

Abstract 在这篇论文中,我们提出了自注意生成对抗网络(SAGAN),它是用于图像生成任务的允许注意力驱动的.长距离依赖的建模.传统的卷积GANs只根据低分辨率图上的空间局部点生成高分辨率细节.在SAGAN中,可以使用来自所有特征位置的线索生成细节.此外,判别器可以检查图像中较远部分的细节特征是否一致.此外,最近的研究表明,生成器条件会影响GAN的性能.利用这一观点,我们将光谱归一化应用到GAN生成器上,发现这改善了训练的动态.提出的SAGAN比以前的研究的效果更好,在ImageNet数据…

CVAE-GAN论文学习-1

CVAE-GAN: Fine-Grained Image Generation through Asymmetric Training 摘要我们提出了一个变分生成对抗网络,一个包含了与生成对抗网络结合的变分子编码器,用于合成细粒度类别的图像,比如具体某个人的脸或者某个类别的目标.我们的方法构建一张图片作为概率模型中的一个标签成分和潜在属性.通过调整输入结果生成模型的细粒度类别标签,我们能够通过随机绘制潜在属性向量中的值来生成指定类别的图像.我们方法的创新点在于两个方面: 首先是我们提出了在判别…

mtcnn论文学习

Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks 使用多任务级联卷积网络连接人脸检测和对齐摘要-因为可能有着多种姿势.照明和遮挡(various poses, illuminations and occlusions),在非限制环境下的人脸检测和对齐是很有挑战性的.目前的研究显示了深度学习方法能够在这两个任务上获得优异的性能.在该论文中,我们提出了一个深度级联多任务框架,用来探…

IMDB-WIKI – 500k+ face images with age and gender labels论文学习

DEX: Deep EXpectation of apparent age from a single image 这个论文我们使用深度学习解决了在静态人脸图像中面部年龄的估计.我们的卷积神经网络使用了VGG-16结构,并在用于图像分类的ImageNet的数据集上预训练.除此之外,由于面部年龄的注释图像数量的限制,我们探究了微调带有可用年龄的爬取的网络人脸图片的好处.我们从IMDB和Wikipedia上爬取了0.5百万张名人的图片,并公布出来.这是目前为止最大的用于年龄检测的数据集.我们提出了将…

SSD论文学习

SSD: Single Shot MultiBox Detector——目标检测参考https://blog.csdn.net/u010167269/article/details/52563573 目标检测算法可分为两种类型:one-stage和two-stage,两者的区别在于前者是直接基于网络提取到的特征和预定义的框(anchor)进行目标预测:后者是先通过网络提取到的特征和预定义的框学习得到候选框(region of interest,RoI),然后基于候选框的特征进行目标检测 one…

sppNet论文学习

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 深度神经网络中用于视觉识别的空间金字塔池化 1.INTRODUCTION 一般的深度神经网络都会设定一个固定的输入图片大小,比如 224*224,因此一般在数据处理时我们会将输入的数据进行裁剪或按比例缩放,在这种情况下就会导致输入的图片出现目标内容缺失或者是目标内容发生形变,即尺度误差或者形变误差,导致检测精确度的下降所以提出了一种带着另一…

R-CNN论文学习

Rich feature hierarchies for accurate object detection and semantic segmentation Tech report (v5) primary首要的 primate原始的 homogeneous均匀的 deformable可变形的在最近几年中,在PASCAL VOC数据集上测量的目标检测的性能已经趋于平稳.性能最好的方法是复杂的.可理解的系统,这些系统通常将多个底层图像特性与高层上下文结合起来.在这篇论文中,我们提出了一个简单…

Fast RCNN论文学习

Fast RCNN建立在以前使用深度卷积网络有效分类目标proposals的工作的基础上.使用了几个创新点来改善训练和测试的速度,同时还能增加检测的精确度.Fast RCNN训练VGG16网络的速度是RCNN速度的9倍,测试时的速度是其的213倍.与SPPnet对比,Fast RCNN训练VGG16网络的速度是其速度的3倍,测试时的速度是其的10倍,而且还更加准确了.Fast RCNN使用Python和C++(使用caffe)实现的,并且能够再开源MIT License 中获得代码,网址为:ht…

论文学习——《Learning to Compose with Professional Photographs on the Web》 (ACM MM 2017)

总结 1.这篇论文的思路基于一个简单的假设:专业摄影师拍出来的图片一般具备比较好的构图,而如果从他们的图片中随机抠出一块,那抠出的图片大概率就毁了.也就是说,原图在构图方面的分数应该高于抠出来的图片.而这种比较的方式,可以很方便地用 Siamese Network 和 hinge loss 实现,如下图所示. 2.另外,这篇论文另一个讨人喜欢的地方在于,它几乎不需要标注数据,只需要在网上爬取很多专业图片,再随机抠图就可以快速构造大量训练样本,因此成本近乎为零,即使精度不高也可以接受,其中作者将数…

论文学习笔记 - Classifification of Hyperspectral and LiDAR Data Using Coupled CNNs

Classifification of Hyperspectral and LiDAR Data Using Coupled CNNs 来源:IEEE TGRS 2020 下载:https://arxiv.org/abs/2002.01144 Abstract 本篇论文的主要工作就是基于信息融合的分类任务. 在这篇论文中,作者通过使用两个耦合的CNN,提出一种融合高光谱和LiDAR数据的框架.设计一个CNN从高光谱数据中了解光谱空间特征,另一个则用于捕获来自LiDAR数据.它们都由三个卷积层组成…