deeplearning.ai 卷积神经网络 Week 1 卷积神经网络听课笔记

1. 传统的边缘检测（比如Sobel）手工设计了3*3的filter（或者叫kernel）的9个权重，在深度学习中，这9个权重都是学习出来的参数，会比手工设计的filter更好，不但可以提取90度、0度的边缘，也可以提取出任意朝向的边缘（比如73度）。把这9个权重当成参数的思想已经成为计算机视觉中最为有效的思想之一。

2. Padding

　　对于原始的卷积操作，原图分辨率为n*n，filter分辨率为f*f，则卷积后的结果是 (n-f+1)*(n-f+1)。有两个缺点：1）每次卷积操作都会把图像缩小；2）边缘像素的使用次数比中间像素少，这意味着丢掉了图像的很多边缘信息。为了解决这两个问题，可以在做卷积操作前，先填充（pad）原图。每边填充p个像素，则原图拓展成 (n+2p)*(n+2p) 的分辨率。

　　p的选择分两种，1）Valid卷积：没有填充，p=0；2）Same卷积：输出和输入有相同的尺寸，p=(f+1)/2。计算机视觉里，f几乎永远是奇数。

3. Stride（步长）

　　步长为s，则输出的分辨率为 ((n+2p-f)/s+1)*((n+2p-f)/s+1)。如果(n+2p-f)/s不为整数，则向下取整到最近的整数（floor），这个物理意义是只有filter在输入图像内部或者填充后的图像区域才计算卷积，如果filter移动到外面，则不计算。

4. Cross-correlation vs. convolution

　　卷积的数学定义有flip的步骤，我们这边做的严格说叫corss-correlation（互相关）。但是在深度学习的文献中，按照惯例，我们还是称之为卷积，虽然我们并没有flip的操作。在数学、信号处理中，flip很重要是因为它有结合律的性质，(A*B)*C=A*(B*C)。但在图像处理里，这个性质不重要，所以省去了flip的操作。

5. 多通道图像的卷积

　　对于n*n*n_c的多通道图像，filter是f*f*n_c，得到 (n-f+1)*(n-f+1) 的图像。通道数必须一致。

　　每个filter对应一个特征（比如垂直方向边缘），如果要得到多个特征，则要使用多个filter，每个filter都是f*f*n_c，然后把每个filter的结果堆叠起来，这时的结果是 (n-f+1)*(n-f+1)*n_c' ，这里n_c'是filter的数量，也就是下一层网络的输入图像的通道数。

　　这里所谓的“通道（channel）”在一些文献里也被称为“深度（depth）”，NG觉得通道更好，因为深度会和神经网络的深度混淆。

6. 单层卷积网络

　　对于第l层的卷机网络，f^[l]是filter的大小（即第l层的filter大小为f*f），p^[l]表示padding的像素数量，s^[l]表示stride的大小，输入图像是n_h^[l-1]*n_w^[l-1]*n_c^[l-1]，输出图像是n_h^[l]*n_w^[l]*n_c^[l]，其中n_h/w^[l]=floor( (n_h/w^[l-1]+2p^[l]-f^[l])/s^[l]+1 )，n_c^[l]是这一层的filter的数量，每个filter的大小是f^[l]*f^[l]*n_c^[l-1]。激活后的输出a[l]的大小是n_h^[l]*n_w^[l]*n_c^[l]，如果有m个样本，向量化之后的激活输出A^[l]的大小是m*n_h^[l]*n_w^[l]*n_c^[l]。权重的大小是f^[l]*f^[l]*n_c^[l-1]*n_c^[l]。bias的大小是n_c^[l]，python里的size是 (1, 1, 1, n_c^[l])。图像的长宽和通道的排序并没有统一，这里NG是把通道放最后（即n_h*n_w*n_c），有的代码是放最前面（即n_c*n_h*n_w）。

　　例子：如果有10个3*3*3的filter，这一层网络一共有(3*3*3+1)*10=280个参数。对于任意大小的图像，这层网络都只有280个参数，这有效控制住了参数的数量，防止过拟合。

7. 池化层

　　和卷积操作一样，也是用filter对原图进行操作，超参数是filter的大小f和步长s。一般 f=2，s=2，效果相当于高度和宽度各缩减一半。也有 f=3，s=2的情况。没有需要学习的参数。目的：缩减模型的大小，提高计算速度，提高所提取特征的鲁棒性。

　　Max pooling：直观解释：只要filter的区域内提取到某个特征，它都会被保留在输出里。

　　Average pooling：filter内取平均。

　　Max pooling是最常用的。对于特别深的网络，也许会用average pooling来处理很多通道的数据（比如7*7*1000，整个空间内求平均值得到1*1*1000）。也可以根据自己的意愿做padding，则多一个超参数p，但padding的操作非常非常少用。一般池化层filter的通道数为1，对输入的每个通道单独处理，所以输入有几个通道，输出也是几个通道。

8. 卷积神经网络

　　前向传播中，随着层数越来越深，图像往往越来越小（开始阶段可能保持相同大小），通道数越来越多。

　　卷积神经网络一般包含：卷积层（CONV）、池化层（POOL）、全连接层（FC）。池化层没有需要学习的参数，只有超参数。卷积层的参数相对少，大部分参数都在全连接层。

　　一般一个或多个卷积层后会跟一个池化层，最后几个全连接层（最后一层也许是softmax）。有的书把卷积层、池化层合起来称做一层，有的书把卷积层、池化层分开来算。NG说我们在说深度学习网络有多少层时只考虑有权重的层，由于池化层没有，所以他就把卷积层、池化层合起来称做一层。

9. 卷积层的优点

　　相比于全连接层，卷积层的两个主要优势：1）参数共享（parameter sharing），某种特征提取器（比如垂直方向的边缘检测）在图像的某一部分适用，那么在其他部分也适用。2）稀疏连接（sparsity of connections），输出的每个元素只与一部分输入有关，从而预防过拟合。

deeplearning.ai 卷积神经网络 Week 1 卷积神经网络听课笔记的更多相关文章

deeplearning.ai 人工智能行业大师访谈 Andrej Karpathy 听课笔记
1. 本科的时候在多伦多大学上Geoffrey Hinton的课,在MNIST数字数据集上训练受限玻尔兹曼机,觉得很有趣.后来在UBC读硕士,上了另一门机器学习的课,那是他第一次深入了解神经网络的相关 ...
deeplearning.ai 人工智能行业大师访谈 Geoffrey Hinton 听课笔记
1. 怀揣着对大脑如何存储记忆的好奇,Hinton本科最开始学习生物学和物理学,然后放弃,转而学习哲学:然后觉得哲学也不靠谱,转而学习心理学:然后觉得心理学在解释大脑运作方面也不给力,转而做了一段时间 ...
deeplearning.ai 人工智能行业大师访谈 Yoshua Bengio 听课笔记
1. 如何走上人工智能的研究的?Bengio说他小时候读了很多科幻小说,1985年(64年出生,21岁)研究生阶段开始阅读神经网络方面的论文,对这个领域产生了热情. 2. 如何看深度学习这些年的发展? ...
deeplearning.ai 人工智能行业大师访谈 Ian Goodfellow 听课笔记
1. Ian Goodfellow之前是做神经科学研究,在斯坦福上了Andrew NG的课之后,Ian决定投身AI.在寒假他和小伙伴读了Hinton的论文,然后搭了一台用CUDA跑Boltzmann ...
deeplearning.ai 人工智能行业大师访谈 Pieter Abbeel 听课笔记
1. Pieter Abbeel小时候想做一个篮球运动员 - -!上学的时候喜欢数学和物理,上大学之后很自然的学工程.Pieter定义工程问题是"解决实际中应用物理和数学的问题". ...
deeplearning.ai 人工智能行业大师访谈 Ruslan Salakhutdinov 听课笔记
Ruslan Salakhutdinov一方面是苹果的研究主管,另一方面是CMU的教授. 1. Ruslan说自己进入深度学习完全是运气,他在多伦多大学读硕士,然后休学了一年,他在金融领域工作,那时候 ...
deeplearning.ai 卷积神经网络 Week 3 目标检测听课笔记
本周的主题是对象检测(object detection):不但需要检测出物体(image classification),还要能定位出在图片的具体位置(classification with loca ...
DeepLearning.ai学习笔记（四）卷积神经网络 -- week3 目标检测
一.目标定位这一小节视频主要介绍了我们在实现目标定位时标签该如何定义. 上图左下角给出了损失函数的计算公式(这里使用的是平方差) 如图示,加入我们需要定位出图像中是否有pedestrian,car, ...
deeplearning.ai 卷积神经网络 Week 2 深度卷积网络：实例研究听课笔记
1. Case study:学习经典网络的原因是它们可以被迁移到其他任务中. 1.1)几种经典的网络: a)LeNet-5(LeCun et al., 1998. Gradient-based lea ...
吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（CNN）（上）
作者:szx_spark 1. Padding 在卷积操作中,过滤器(又称核)的大小通常为奇数,如3x3,5x5.这样的好处有两点: 在特征图(二维卷积)中就会存在一个中心像素点.有一个中心像素点会十 ...

随机推荐

转换函数TO_CHAR，TO_DATE，TO_NUMBER
TO_CHAR:将日期.数字转为字符串. TO_DATE:将字符串转为日期(注:无数字转日期). TO_NUMBER:将字符串转为数字(注:无日期转数字).此函数作用不大,算术运算时Oracel会自动 ...
sqlserver 存储过程增加
CREATE PROCEDURE [dbo].[InsertMessage]( @strTable varchar(), --表名 @strValues nvarchar(), --要插入的数据(用英 ...
linux下增加磁盘改变指定文件路径分区挂载点和迁移数据
Centos7 系统上原有目录/data 挂载根目录下,空间有点小,我们需要把/data目录挂载到另一个磁盘,同时把数据迁移. 1.查看分区情况 fdisk -l 2.查看路径对应分区情况 df -l ...
sed使用范例
本文同时发表在https://github.com/zhangyachen/zhangyachen.github.io/issues/32 记录下sed编译器的常见使用方法. sed编辑器基于输入到命 ...
20行JS代码实现贪吃蛇
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
三：Redis连接池、JedisPool详解、Redisi分布式
单机模式: package com.ljq.utils; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; ...
Java Web高级编程（二）
使用会话维持状态一.会话为了实现关联同一个用户端的多个请求和这些请求之间数据的共享,需要用到会话,会话用于维持请求和请求之间的状态.从服务器的角度,当用户的Web浏览器打开第一个链接到服务器的套接 ...
第五章 MVC之Bundle详解
一.简述 Bundle,英文原意就是捆.收集.归拢.在MVC中的Bundle技术,也就是一个对css和js文件的捆绑压缩的技术. 它的用处: 将多个请求捆绑为一个请求,减少服务器请求数压缩javas ...
Scrapy1.4爬取笑话网站数据，Python3.5+Django2.0构建笑话应用
Part1:需求简要描述 1.抓取http://www.jokeji.cn网站的笑话 2.以瀑布流方式显示 Part2:安装爬虫框架Scrapy1.4 1. 安装Scrapy1.4 E:\django ...
Nginx集群之WCF分布式消息队列
目录 1 大概思路... 1 2 Nginx集群之WCF分布式消息队列... 1 3 MSMQ消息队列... 2 4 编写WCF服务.客户端程序... ...

deeplearning.ai 卷积神经网络 Week 1 卷积神经网络 听课笔记

deeplearning.ai 卷积神经网络 Week 1 卷积神经网络 听课笔记的更多相关文章

随机推荐

热门专题

deeplearning.ai 卷积神经网络 Week 1 卷积神经网络听课笔记

deeplearning.ai 卷积神经网络 Week 1 卷积神经网络听课笔记的更多相关文章