CS231n笔记 Lecture 5 Convolutional Neural Networks

zhsuiy 2024-09-03 15:11:30 原文

一些ConvNets的应用

Face recognition
输入人脸，推测是谁
Video classfication
Recognition
识别身体的部位, 医学图像, 星空, 标志牌, 鲸...
图像描述 Image Captioning
transfer

卷积操作和信号处理的卷积操作的区别

印象中在学习数字图像处理这门课的时候，里面提到过卷积操作，当时的计算方法是，需要把卷积核作一个180度的旋转。其实在最开始听到“卷积神经网络“并开始在探究具体如何进行卷积操作的时候，我也有过这个疑惑，这里的卷积需要旋转吗?但是我当时不求甚解，没有深入地探查到底为什么。今天的课上，有一个同学把这个问题问了出来，Serena的回答是，我们在CNN里用的卷积实际上就是一个element wise的操作，只是思想上和信号处理的卷积相似，但具体计算还是有所区别了。感觉得到了官方的回复，这下可以少一些疑虑了。

卷积操作

计算

filter也是带有深度的，只是在很多时候这个*3被省略了。
但是，在经过一次计算后，这个深度信息（3）就没有了，或者是说被重新映射了，深度的个数取决于filter的个数。

输入输出的维度计算

这里需要注意的是，输出的图像为323210，此时已经没有所谓的rgb，新的通道个数为10，这是因为用了10个filter来做卷积。

参数个数

参数个数实际上就是filter里面元素的个数，由于共有10个55filter，且每个filter实际上是55*3的，外加1个bias项，所以总共的参数个数是760。

pooling

只spatially变小，depth保持不变。

为什么要用max pooling而不是average pooling？

因为每个region实际上是记录了一个激活强度，用max的话可以把这个激活强度最大程度地保留。（存疑）

为什么不直接用stride来做down sampling

当我们设置stride时，output的维度也会降低，Serena解释说这二者其实并没有太多本质的区别，而且最新的网络，大家也开始尝试用stride代替pooling来做down sampling.

CS231n笔记 Lecture 5 Convolutional Neural Networks的更多相关文章

【论文笔记】Learning Convolutional Neural Networks for Graphs
Learning Convolutional Neural Networks for Graphs 2018-01-17 21:41:57 [Introduction] 这篇 paper 是发表在 ...
论文笔记——MobileNets(Efficient Convolutional Neural Networks for Mobile Vision Applications)
论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet由Go ...
cs231n spring 2017 lecture5 Convolutional Neural Networks听课笔记
1. 之前课程里,一个32*32*3的图像被展成3072*1的向量,左乘大小为10*3072的权重矩阵W,可以得到一个10*1的得分,分别对应10类标签. 在Convolution Layer里,图像 ...
cs231n spring 2017 lecture5 Convolutional Neural Networks
1. 之前课程里,一个32*32*3的图像被展成3072*1的向量,左乘大小为10*3072的权重矩阵W,可以得到一个10*1的得分,分别对应10类标签. 在Convolution Layer里,图像 ...
深度学习笔记 (一) 卷积神经网络基础 (Foundation of Convolutional Neural Networks)
一.卷积卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络.使用数层卷积,而不是数层的矩阵相乘.在图像的处理过程中,每一张图片都可以看成一张“ ...
阅读笔记 The Impact of Imbalanced Training Data for Convolutional Neural Networks [DegreeProject2015] 数据分析型
The Impact of Imbalanced Training Data for Convolutional Neural Networks Paulina Hensman and David M ...
论文笔记之：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking
Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking arXiv Paper ...
论文笔记之：Learning Multi-Domain Convolutional Neural Networks for Visual Tracking
Learning Multi-Domain Convolutional Neural Networks for Visual Tracking CVPR 2016 本文提出了一种新的CNN 框架来处理 ...
[CVPR2015] Is object localization for free? – Weakly-supervised learning with convolutional neural networks论文笔记
p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...

随机推荐

python爬虫之路——初识爬虫三大库，requests,lxml,beautiful.
三大库:requests,lxml,beautifulSoup. Request库作用:请求网站获取网页数据. get()的基本使用方法 #导入库 import requests #向网站发送请求,获 ...
使用工具Source Monitor测量您Java代码的环复杂度
代码的环复杂度(Cyclomatic complexity,有时也翻译成圈复杂度)是一种代码复杂度的衡量标准,在1976年由Thomas J. McCabe, Sr. 提出. 来看看计算公式. 代码环 ...
SAP OData编程指南
OData(Open Data Protocol)协议是一个开放的工业标准,用于定义RESTFul API的设计和使用.我的文章标题前加上SAP的前缀,只是为了表明这篇文章介绍的是Jerry在SAP项 ...
Android（java）学习笔记134：Android数据存储5种方式总结
1.使用文件(File)存储存储一般的数据 2.使用sharedperference(xml) 存储设置信息.配置信息.密码 3.数据库Sqlite 开源的,嵌入式的数据库,轻量级 4.使用Cont ...
Python 求两个文本文件以行为单位的交集并集差集
Python 求两个文本文件以行为单位的交集并集差集,来代码: s1 = set(open('a.txt','r').readlines()) s2 = set(open('b.txt','r') ...
CentOS为用户增加root权限
1.修改 /etc/sudoers vi /etc/sudoers 在下边增加一行内容 root ALL=(ALL) ALLusername ALL=(ALL) ALL 2. ...
VMware vSphere6.0 服务器虚拟化部署安装图解
一 VMware vSphere部署的前期规划要点 1 vSphere的优点 (略) 2 如何利用现在的设备架构虚拟化环境在虚拟化过程中,用户大多会考虑目前现有的服务器.存储.交换机等基础设备是否可 ...
bootstrap历练实例：面板脚注
面板脚注我们可以在面板中添加脚注,只需要把按钮或者副文本放在带有 class .panel-footer 的 <div> 中即可.下面的实例演示了这点: <!DOCTYPE htm ...
NSOperation、NSOperationQueue
NSOperation.NSOperationQueue NSOperation 和 NSOperationQueue 配合使用也能实现多线程. NSOperation 继承于 NSObject,是一 ...
【最大权闭合子图 tarjan】bzoj1565: [NOI2009]植物大战僵尸
dinic+tarjan板子练手题 Description Plants vs. Zombies(PVZ)是最近十分风靡的一款小游戏.Plants(植物)和Zombies(僵尸)是游戏的主角,其中P ...