介绍

AlexNet是LeNet的一种更深更宽的版本。首次在CNN中应用ReLU、Dropout和LRN,GPU进行运算加速。

一共有13层,有8个需要训练参数的层(不包括池化层和LRN层),前5层是卷积层,后三层是全连接层。

最后一层是有1000个类输出的softmax层用作分类。

前言

截取224*224,实际上又扩充了一个边界,成为227*227,论文里面224*224是有问题的

局部响应归一化计算的时候是有一个尺寸的,5*5或者10*10的邻域范围。

输入图片实际上是227*227

为什么需要庞大的全连接神经网络来分类呢?因为特征提取出来后,特征空间不好分,高度非线性特征空间,所以要这么多fc,如果好分,一个fc就可以了

relu可以原位计算,在caffe中,在conv的输出矩阵中马上就可以进行原位计算,不用存下来,再去计算relu

lrn也不改变尺寸

为什么需要这么多的卷积核?因为每一个卷积核都是不同的特征提取方法,不同的角度提取数据,增加了每个特征的独特性,特征空间的可塑性

特征图慢慢变小,响应的你的kernel_size也要降下来,刚开始可以很大

kernelsize=3 3 ÷2=1.5 所以pad选1???????

注意上一部分用池化,这一部分不用池化,这根特征图是哟关系的,为了保证深度达到一定程度,不能把图像弄得很小,不然怎么展开呢???????
conv没有进行降维

mlp 多层感知器

fc可以看成conv,只要kernelsize=输入特征图的size,s=1,pad=0就可以,这样相当于kernel没有进行滑动,只进行了一次内积

dropout放在data后面,是一部分失活,实际上输出的4096中有一部分是失活的

最后

刚才我们的实现是把max pool放在前面,没有关系

maxpool用了三次,是用来降低维数

一开始图像比较大,图像是局部相关的,大的图像局部相关的区域也比较大,所以就用大一点的kernel来计算,step也大一点,之后convstep会慢慢变小

虽然conv计算量特别大,但是参数量特别小,主要是因为数据量特别大,全连接层少,但是宽度特别宽,数据量越来越少,参数量越来越多,从开始到最后的max pool可以看成一个特征提取器

特征向量非常长,特征空间是非常高维的特征空间,这么高维的特征空间肯定需要特别大的特征参数,才能够有足够的自由度来调整决策边界,来达到足够高的精度,这个就是为什么参数特别多的原因,参数越多,自由度越大,决策边界越好调节,特征空间的划分就越自由..

AlexNet (ImageNet模型)的更多相关文章

  1. 【神经网络与深度学习】学习笔记:AlexNet&Imagenet学习笔记

    学习笔记:AlexNet&Imagenet学习笔记 ImageNet(http://www.image-net.org)是李菲菲组的图像库,和WordNet 可以结合使用 (毕业于Caltec ...

  2. 将训练集构建成ImageNet模型

    以下程序实现将训练集构建为ImageNet模型,训练集图片为56个民族 import java.io.File; import java.io.FileNotFoundException; impor ...

  3. AlexNet——ImageNet Classification with Deep Convolutional Neural Networks

    1. 摘要 本文的模型采用了 5 层的卷积,一些层后面还紧跟着最大池化层,和 3 层的全连接,最后是一个 1000 维的 softmax 来进行分类. 为了减少过拟合,在全连接层采取了 dropout ...

  4. 【caffe】用训练好的imagenet模型分类图像

    因为毕设需要,我首先是用ffmpeg抽取某个宠物视频的关键帧,然后用caffe对这个关键帧中的物体进行分类. 1.抽取关键帧的命令: E:\graduation design\FFMPEG\bin&g ...

  5. AlexNet: ImageNet Classification with Deep Convolutional Neural Networks

    目录 激活函数 防止过拟合 增加数据 Dropout 细节 代码 AlexNet 上图是论文的网络的结构图,包括5个卷积层和3个全连接层,作者还特别强调,depth的重要性,少一层结果就会变差,所以这 ...

  6. 训练 smallcorgi/Faster-RCNN_TF 模型(附ImageNet model百度云下载地址)

    1. 下载训练.验证.测试数据和 VOCdevkit,下载地址: http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2 ...

  7. 图像分类丨ILSVRC历届冠军网络「从AlexNet到SENet」

    前言 深度卷积网络极大地推进深度学习各领域的发展,ILSVRC作为最具影响力的竞赛功不可没,促使了许多经典工作.我梳理了ILSVRC分类任务的各届冠军和亚军网络,简单介绍了它们的核心思想.网络架构及其 ...

  8. 小白的经典CNN复现(三):AlexNet

    小白的经典CNN复现(三):AlexNet 锵锵--本系列的第三弹AlexNet终于是来啦(≧∀≦),到了这里,我们的CNN的结构就基本上和现在我们经常使用或者接触的一些基本结构差不多了,并且从这一个 ...

  9. tensorflow版的bvlc模型

    研究相关的图片分类,偶然看到bvlc模型,但是没有tensorflow版本的,所以将caffe版本的改成了tensorflow的: 关于模型这个图: 下面贴出通用模板: from __future__ ...

随机推荐

  1. apiCloud中实现头部与内容分离与操作规范,App头部header固定,头部与内容分离

    官方案例 1.头部拆分成一个页面比如news-text <!doctype html> <html> <head> <meta charset="u ...

  2. zzulioj--1600--直线与圆(简单数学几何)

     1600: 直线与圆 Time Limit: 1 Sec  Memory Limit: 128 MB Submit: 360  Solved: 73 SubmitStatusWeb Board ...

  3. caffe中lenet_train_test.prototxt配置文件注解

    caffe框架下的lenet.prototxt定义了一个广义上的LeNet模型,对MNIST数据库进行训练实际使用的是lenet_train_test.prototxt模型. lenet_train_ ...

  4. DB-MySQL:MySQL 函数

    ylbtech-DB-MySQL:MySQL 函数 1. MySQL 字符串函数返回顶部 1. MySQL 字符串函数 函数 描述 实例 ASCII(s) 返回字符串 s 的第一个字符的 ASCII ...

  5. oracle-常见的执行计划(一)

    一.表访问方式 CBO基础概念中有讲到,访问表的方式有两种:全表扫描和ROWID扫描. 全表扫描的执行计划:TABLE ACCESS FULL ROWID扫描对应执行计划:TABLE ACCESS B ...

  6. TortoiseGit连接github.com

    1.下载两个软件:msysgit,TortoiseGit 2.先安装msysgit,再安装TortoiseGit,安装过程保持默认即可. 3.为了安全,我们需要使ssh key.开始菜单--Torto ...

  7. XML学习(一)——xml内容简介

    一.什么是XML xml全称为Extensible Markup Language,意思是可扩展的标记语言.XML语法上和HTML比较相似,但是HTML中的元素是固定的,而XML的标签是可以用户定义的 ...

  8. ASP调用WebService转化成JSON数据,附json.min.asp

    首先定义SOAP数据,然后创建HTTP对象,然后使用POST提交,获取状态码为200,就说明调用成功,再进行下一步操作…… <!--#Include virtual="/Include ...

  9. swift语言点评六-Numbers and Basic Values

    Topics Logical Values struct Bool A value type whose instances are either true or false. Numeric Val ...

  10. (2016北京集训十三)【xsy1532】网络战争 - 最小割树+树上倍增+KD树

    题解: 好题!! 这题似乎能上我代码长度记录的前五? 调试时间长度应该也能上前五QAQ 首先题目要求的明显就是最小割,当然在整个森林上求Q次最小割肯定是会GG的,所以我们需要一个能快速求最小割的算法— ...