论文笔记《ImageNet Classification with Deep Convolutional Neural Network》

一、摘要

了解CNN必读的一篇论文，有些东西还是可以了解的。

二、结构

1、 Relu的好处： 1、在训练时间上，比tanh和sigmod快，而且BP的时候求导也很容易

2、因为是非饱和函数，所以基本不会出现梯度消失的情况

Relu只要控制好learing rate，可以说是完胜之前的激活函数，也因此可以帮助我们训练更深层次的网络。

现在对Relu的进一步增强还有研究，有兴趣可以了解。

2、GPU并行计算在当时是个很好思路，不过作者的trick就有点...虽然说是通过cross-validation得到的结论，但我觉得对以后的研究，意义不是很大

3、局部归一化应该也是一个trick，暂时没接触过..以后再看看

4、overlapping pooling也是在后来没怎么听说过的..

三、减少过拟合

1、数据增加

（1）图像变换

这是一个非常好，也非常常用且非常实用的方法...

原始图像为一个大图a，想把一短边缩小到256维得到b，然后在b的中心取256*256的正方形图片得到c，然后在c上随机提取224*224的小图片作为训练样本，然后在结合图像水平反转来增加样本达到数据增益。这种增益方法是样本增加了2048倍，允许我们运行更大的网络。

（2）调整RGB值

具体思路是：对三个channel分别做PCA分析，得到主成成分后，在相应的维度上做一些jittter，增加或减少一些服从高斯分布，标准差为0.1的随机变量，这样可以得到一些和原来相似且有意义的数据。

2、Dropout

这也是一个相当牛逼的技术，通过对神经元概率话的激活，既可以达到多个模型combine的效果（因为每次的结构都不同，但又共享参数），有不用花太多的时间去训练多个网络。

四、思考

有几个问题还是可以拎出来想想的。

1，两个GPU基本是一样的环境，但训练出来的卷积核却完全不同，why？

2.还是网络结构的问题，为什么这样就可以...

五、总结

说实话，看完这篇论文并没有学到太多，不是这篇文章不牛逼，而是太牛逼了，以至于后面大多数CNN方面的研究都用到了里面的理论，所以很多都有种似曾相识的感觉，但作为CNN的翻身之作，确实值得一读！

论文笔记《ImageNet Classification with Deep Convolutional Neural Network》的更多相关文章

《Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition》论文笔记
论文题目:<Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition> 论文作者:Qibin ...
[place recognition]NetVLAD: CNN architecture for weakly supervised place recognition 论文翻译及解析（转）
https://blog.csdn.net/qq_32417287/article/details/80102466 abstract introduction method overview Dee ...
论文笔记系列-Auto-DeepLab:Hierarchical Neural Architecture Search for Semantic Image Segmentation
Pytorch实现代码:https://github.com/MenghaoGuo/AutoDeeplab 创新点 cell-level and network-level search 以往的NAS ...
论文笔记——Rethinking the Inception Architecture for Computer Vision
1. 论文思想 factorized convolutions and aggressive regularization. 本文给出了一些网络设计的技巧. 2. 结果用5G的计算量和25M的参数. ...
论文笔记：Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...
论文笔记：ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware
ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware 2019-03-19 16:13:18 Pape ...
论文笔记：DARTS: Differentiable Architecture Search
DARTS: Differentiable Architecture Search 2019-03-19 10:04:26accepted by ICLR 2019 Paper:https://arx ...
论文笔记：Progressive Neural Architecture Search
Progressive Neural Architecture Search 2019-03-18 20:28:13 Paper:http://openaccess.thecvf.com/conten ...
论文笔记：Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation
Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation2019-03-18 14:4 ...
论文笔记系列-DARTS: Differentiable Architecture Search
Summary 我的理解就是原本节点和节点之间操作是离散的,因为就是从若干个操作中选择某一个,而作者试图使用softmax和relaxation(松弛化)将操作连续化,所以模型结构搜索的任务就转变成了 ...

随机推荐

C#创建和使用ActiveX组件
开发基于.Net平台上的程序员是很难从本质上把Visual C#和ActiveX组件联起来,虽然在使用Visual C#开发应用程序时,有时为了快速开发或者由于.Net FrameWork SDK的不 ...
区块链工作 jd
https://www.lagou.com/jobs/4096098.html 技术咨询网站: https://mp.weixin.qq.com/s/hs37UZFGI3uR4qmQ7v346g## ...
css中让元素隐藏的多种方法
{ display: none; /* 不占据空间,无法点击 / } { visibility: hidden; / 占据空间,无法点击 / } { position: absolute; top: ...
[基础学习]MySQL常用语句命令总结
前言相信平时大家在开发时都会使用MySQL数据库,它是目前比较火的一款数据库工具,对于大多数企业的业务来说,MySQL可以很完美地支持了. 很多时候我们都是借助mysql可视化工具操作mysql,虽 ...
如何使用pyinstaller打包32位的exe
说明:原来安装的python为64位,故安装的pyinstaller和打包后的exe都为64位.而64位的exe文件在32位的win7操作系统下是无法执行的,显示不兼容.网上查询发现,简单(可能不方便 ...
GoF23种设计模式之创建型模式之工厂方法模式
一.概述定义一个用于创建对象的接口,让子类去决定实例化哪个类.工厂方法将一个类的实例化延迟至其子类. 二.适用性 1.当一个类不知道它所必须创建的对象的类的时候. 2.当一个类希望由其子类来指定它所 ...
算法训练 Eurodiffusion
Eurodiffusion /***********并未完全AC***********/ #include<iostream> #include<algorithm> #inc ...
7、python中的字典
字典是python内置的一种无序.可变的数据结构. 字典也叫哈希表.什么是哈希表?哈希表就是会对表中的键(key)执行哈希计算,并根据计算结果在内存中分配一个区域来储存该键所对应的值(value).这 ...
loj2061 「HAOI2016」放棋子
答案就是错排数 n = int(input()) f = [0] * 205 f[0] = 1 for i in range(2, n+1): f[i] = (i-1) * (f[i-1] + f[i ...

论文笔记《ImageNet Classification with Deep Convolutional Neural Network》

论文笔记《ImageNet Classification with Deep Convolutional Neural Network》的更多相关文章

随机推荐

热门专题