cs231n spring 2017 lecture4 Introduction to Neural Networks 听课笔记

1. Backpropagation：沿着computational graph利用链式法则求导。每个神经元有两个输入x、y，一个输出z，好多层这种神经元连接起来，这时候已知∂L/∂z，可以求出∂L/∂x = ∂L/∂z * ∂z/∂x，∂L/∂y = ∂L/∂z * ∂z/∂y。靠这种方式可以计算出最终的loss function相对于最开始的输入的导数。

这种方法的好处是，每个神经元都是很简单的运算（比如加、减、乘、除、指数、sigmoid等），它们导数的解析式是很容易求解的，用链式法则连乘起来就得到了我们需要的导数。如果直接求的话会很复杂很难求。

2. Add(x, y)是gradient distributor，把后面神经元的导数反向传递给x和y。

Max(x, y)是gradient router，它只会反向传递给x、y中大的那一个。可以这么直观的理解，由于只有x、y中大的那个数被传递到后面的神经元对最后结果产生影响，所以在反向传递的时候，也只会评估x、y中大的那个数。

Mul(x, y)是gradient switcher，它把后面神经元的导数分别传递给x和y，传给x的部分乘以y，传给y的部分乘以x。

想想求导公式就明白了。

3. 对于一个输入x，两个输出y、z的神经元，反向传递求导的时候，是把从y和z两路反向传递过来的导数求和。

4. 如果x、y、z等元素都不是标量，而是向量，则求导全部都变成了雅克比矩阵。对于一个4096维输入，4096维输出的系统，雅克比大小为4096*4096，如果minibatch里100个采样，则雅克比变成了409600*409600大小，运算很麻烦。但如果知道输出的某个元素只和输入的某些元素相关，则求偏导的时候只有相关项有值，其他都是0，这个性质可以被用来加速计算。极端的情况，如果输入和输出一一对应，则雅克比是对角矩阵。

5. 深度学习框架（比如Caffe等）的API里，会定义不同的layer，每种layer就是搭神经网络的积木（也就是上文说的神经元节点），每种layer会有自己的forward()/backward()函数，分别用来正向的从输入求出输出，和反向的求loss funciton对这个节点输入的导数。

6. 神经网络，从函数的角度说就是复合函数，把简单函数一层层堆叠起来。例如线性函数f=Wx，则两层的神经网络可能是f=W₂max(0,W₁x)，三层的网络可能是f=W₃max(0, W₂max(0,W₁x))。直观地说，比如在物体分类的问题中，第一层网络训练出的权重可能是一个红色的车的template，而第二层网络的权重可能是不同的颜色，这样两层网络就实现了泛化预测各种颜色的车的目的。

7. 从生物学的角度看，sigmoid函数是非常有道理的，它意味着输入进来的信号不够强的时候输出为0，神经元没有被激活，足够强之后，神经元被激活从而产生输出。ReLU：f(x) = max(0, x)也是同样的想法。这些都是“激活函数”。所以深度学习中实际构造的神经元，通常是一个线性单元复合一个激活函数sigmoid(Wx+b)。

8. 虽然深度学习从脑科学得到了很多启发，但是我们要谨慎的把两者做直接类比，因为生物神经元要复杂的多。

cs231n spring 2017 lecture4 Introduction to Neural Networks 听课笔记的更多相关文章

cs231n spring 2017 lecture4 Introduction to Neural Networks
1. Backpropagation:沿着computational graph利用链式法则求导.每个神经元有两个输入x.y,一个输出z,好多层这种神经元连接起来,这时候已知∂L/∂z,可以求出∂L/ ...
cs231n spring 2017 lecture3 Loss Functions and Optimization 听课笔记
1. Loss function是用来量化评估当前预测的好坏,loss function越小表明预测越好. 几种典型的loss function: 1)Multiclass SVM loss:一般的S ...
cs231n spring 2017 lecture10 Recurrent Neural Networks 听课笔记
(没太听明白,下次重新听一遍) 1. Recurrent Neural Networks
cs231n spring 2017 lecture1 Introduction to Convolutional Neural Networks for Visual Recognition 听课笔记
1. 生物学家做实验发现脑皮层对简单的结构比如角.边有反应,而通过复杂的神经元传递,这些简单的结构最终帮助生物体有了更复杂的视觉系统.1970年David Marr提出的视觉处理流程遵循这样的原则,拿 ...
cs231n spring 2017 lecture1 Introduction to Convolutional Neural Networks for Visual Recognition
1. 生物学家做实验发现脑皮层对简单的结构比如角.边有反应,而通过复杂的神经元传递,这些简单的结构最终帮助生物体有了更复杂的视觉系统.1970年David Marr提出的视觉处理流程遵循这样的原则,拿 ...
cs231n spring 2017 lecture5 Convolutional Neural Networks听课笔记
1. 之前课程里,一个32*32*3的图像被展成3072*1的向量,左乘大小为10*3072的权重矩阵W,可以得到一个10*1的得分,分别对应10类标签. 在Convolution Layer里,图像 ...
cs231n spring 2017 lecture10 Recurrent Neural Networks
(没太听明白,下次重新听一遍) 1. Recurrent Neural Networks
cs231n spring 2017 lecture12 Visualizing and Understanding 听课笔记
这一节课很零碎. 1. 神经网络到底在干嘛? 浅层的是具体的特征(比如边.角.色块等),高层的更抽象,最后的全连接层是把图片编码成一维向量然后和每一类标签作比较.如果直接把图片和标签做像素级的最近领域 ...
cs231n spring 2017 lecture9 CNN Architectures 听课笔记
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...

随机推荐

OC学习12——字符串、日期、日历
前面主要学习了OC的基础知识,接下来将主要学习Foundation框架的一些常用类的常用方法.Foubdation框架是Cocoa编程.IOS编程的基础框架,包括代表字符串的NSString(代表字符 ...
C#基础在using中创建对象
在using中创建的对象的类必须是实现了IDispose接口的类,示例代码如下: static void Main(string[] args) { Method(); Console.WriteLi ...
724. Find Pivot Index
Given an array of integers nums, write a method that returns the "pivot" index of this arr ...
Add to List 349. Intersection of Two Arrays
Given two arrays, write a function to compute their intersection. Example:Given nums1 = [1, 2, 2, 1] ...
453. Minimum Moves to Equal Array Elements
Given anon-emptyinteger array of sizen, find the minimum number of moves required to make all array ...
xamarin android布局
xamarin android布局练习(1) xamarin android布局练习,基础非常重要,首先要学习的就是android的布局练习,xamarin也一样,做了几个xamarin androi ...
Wamp环境搭建常见错误问题解决
第一点.对于apache + php + mysql 的版本的正确选择问题:网上有些教学视频已经很早了,然后很多人照着来,完全和视频里讲的一样,但是结果就是搭建不成功. 出现问题原因:三件套的版本选 ...
vue 回到顶部的小问题
今天在用vue项目中,实现回到顶部功能的时候,我写了一个backTop组件,接下来需要通过监听window.scroll事件来控制这个组件显示隐藏因为可能会有其他的组件会用到这样的逻辑,所以将此功能 ...
Linux(CentOS7.1)修改默认yum源为国内的阿里云yum源
官方的yum源在国内访问效果不佳. 需要改为国内比较好的阿里云或者网易的yum源修改方式: 下载wget yum install wget -y echo 备份当前的yum源 mv /etc/yum ...
Java企业微信开发_11_异常：java.net.UnknownHostException: qyapi.weixin.qq.com
原因: 网络原因导致 dns解析失败. 解决方案: 方案一 : 1.查看你的服务器能否ping通外网,不过不行说明你的网络出了问题. (我的情况是客户的应用服务器只能内网访问,所以是网络出问题 ...

cs231n spring 2017 lecture4 Introduction to Neural Networks 听课笔记

cs231n spring 2017 lecture4 Introduction to Neural Networks 听课笔记的更多相关文章

随机推荐

热门专题