Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 3. 浅层神经网络）

=================第3周浅层神经网络===============

===3..1 神经网络概览===

===3.2 神经网络表示===

===3.3 计算神经网络的输出===

　　方括号代表层数。

===3.4 多个例子中的向量化===

===3.5 向量化实现的解释===

　　方括号值的是层数，括号代表样本编号。ppt中显示的，不同row代表某一层的hidden unit，不同列代表各个样本，挺形象的呀，有趣。

===3.6 激活函数===

　　tanh几乎各方面都比sigmoid好，此时激活函数的平均值就更接近0，这实际上让下一层的学习更方便一点，我们会在下一周详细讨论原因。我几乎不用 σ 激活函数了，一个例外是在输出层。这两个激活函数都有一个缺点，就是z太大或太小时梯度会变很接近0，这将导致学习速度很慢。今天大多数人用的都是Relu，虽然有时人们也会用tanh。Relu的一个缺点是负数部分导数0，但实际证明这并没有什么大问题。Relu is increasingly the default choice of activation function so if you're not sure what to use for your hidden layer，我就用ReLU作为激活函数。Leaky Relu中负轴部分的斜率通常是0.01，也可以把它设成学习算法的另一个参数，有人说这样效果更好，但我很少见到有人这么做。通常比 Relu更好，不过实际中使用的频率没那么高，随便选一个 is ok，如果只能选一个我会选Relu。

===3.7 为什么需要非线性激活函数？===

　　如果你使用线性激活函数，或者如果没有使用激活函数，那么无论你的神经网络有多少层，那么无论你的神经网络有多少层，always doing is just computing a linear activation function。下面ppt左上角，你要是在第一个隐层不加非线性激活，在第2层用sigmod函数，那么这就相当于简单的Logisti回归，我懒得证明了。要点在于，线性隐层一点用都没有，因为两个线性函数的组合本身就是线性函数。除非你做回归问题，那么输出层可以线性，其他隐层几乎都不会使用。

===3.8 激活函数的导数====

　　sigmoid/tanh求导公式的优点在于，如果你已经计算出a值了，那么用这个式子就可以很快算出g(z)的斜率。

　　Relu和Leaky Relu的零点的导数无论归到哪部分都是可以的。

===3.9 神经网络的梯度下降法==

　　单隐层神经网络的反向传播，假设二分类任务，损失函数使用Log损失。加上开关keepdims 就是防止python直接输出这些古怪的rank 1 arrays。运算符 * 代表逐元素相乘。

　　好好体会呗，尤其向量化之后求导 dZ，dW时要注意维度匹配、逐项乘还是矩阵乘、1/m等。

===3.10 （选修）直观理解反向传播===

　　这是我在机器学习领域中看到的最难的推导之一（哈哈哈）。

===3.11 随机初始化===

　　对于logistic回归可以将权重初始化为零，但如果将神经网络的各参数数组全部初始化为0，再使用梯度下降算法，那会完全无效。全部同样的初始值对权重进行初始化，会造成隐藏单元的效果完全一样，意味着节点计算完全一样的函数。我们可以通过归纳法证明每次训练迭代之后，两个隐藏单元仍然在计算完全相同的函数。

　　随机初始化时通常将权重初始化小一点，以免梯度很小，如果你的神经网络中没有任何sigmoid或者tanh激活函数，那问题可能没那么大但如果你在做二元分类，你的输出单元是Sigmoid函数，那么你就不希望初始参数太大，所以用0.01是比较合理的，或者任意其他小数字。

Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 3. 浅层神经网络）的更多相关文章

吴恩达《深度学习》-第一门课 (Neural Networks and Deep Learning)-第三周：浅层神经网络(Shallow neural networks) -课程笔记
第三周:浅层神经网络(Shallow neural networks) 3.1 神经网络概述(Neural Network Overview) 使用符号$ ^{[
deeplearning.ai 神经网络和深度学习 week3 浅层神经网络听课笔记
1. 第i层网络 Z[i] = W[i]A[i-1] + B[i],A[i] = f[i](Z[i]). 其中, W[i]形状是n[i]*n[i-1],n[i]是第i层神经元的数量: A[i-1]是第 ...
deeplearning.ai 神经网络和深度学习 week3 浅层神经网络
1. 第i层网络 Z[i] = W[i]A[i-1] + B[i],A[i] = f[i](Z[i]). 其中, W[i]形状是n[i]*n[i-1],n[i]是第i层神经元的数量: A[i-1]是第 ...
tensorFlow（四）浅层神经网络
tensorFlow见基础实验 MNIST数据集介绍 MNIST是一个手写阿拉伯数字的数据集. 其中包含有60000个已经标注了的训练集,还有10000个用于测试的测试集. 本次实验的任务就是通过手 ...
DeepLearning.ai学习笔记（一）神经网络和深度学习--Week3浅层神经网络
介绍 DeepLearning课程总共五大章节,该系列笔记将按照课程安排进行记录. 另外第一章的前两周的课程在之前的Andrew Ng机器学习课程笔记(博客园)&Andrew Ng机器学习课程 ...
[DeeplearningAI笔记]神经网络与深度学习3.2_3.11(激活函数)浅层神经网络
觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.2 神经网络表示对于一个由输入层,隐藏层,输出层三层所组成的神经网络来说,输入层,即输入数据被称为第0层,中间层被称为第1层,输出层被称为 ...
ng-深度学习-课程笔记-4: 浅层神经网络(Week3)
1 神经网络概览( Neural Networks Overview ) 先来快速过一遍如何实现神经网络. 首先需要输入特征x,参数w和b,计算出z,然后用激活函数计算出a,在神经网络中我们要做多次这 ...
Neural Networks and Deep Learning 课程笔记（第三周）浅层神经网络(Shallow neural networks)
3.1 神经网络概述(Neural Network Overview ) (神经网络中,我们要反复计算a和z,最终得到最后的loss function) 3.2 神经网络的表示(Neural Netw ...
Tensorflow MNIST浅层神经网络的解释和答复
本系列文章由 @yhl_leo 出品,转载请注明出处. 文章链接: http://blog.csdn.net/yhl_leo/article/details/51416540 看到之前的一篇博文:深入 ...

随机推荐

Java集合（十）实现Map接口的HashMap
Java集合(十)继承Map接口的HashMap 一.HashMap简介(基于JDK1.8) HashMap是基于哈希表(散列表),实现Map接口的双列集合,数据结构是“链表散列”,也就是数组+链表 ...
Spring AMQP:RabbitTemplate SimpleMessageListenerContainer
一.RabbitTemplate介绍 RabbitTemplate:消息模板,在与Spring AMQP整合时,进行发送消息的关键类. 包括了可靠性投递消息方法.回调监听消息接口ConfirmCall ...
Rocket - debug - dm registers
https://mp.weixin.qq.com/s/P48K17TyRoZC7xBMltbXKQ 简单介绍调试模块中每个寄存器的定义. 1. DMI_RegAddrs 记录DMI访问的各个寄存器的地 ...
Rocket - regmapper - RegField
https://mp.weixin.qq.com/s/7WKB1QxcVzqm2Q7bWcKHzA 简单介绍RegField的实现. 1. 简单介绍定义寄存器域相关的参数类型. 2. RegFiel ...
Rocket - tilelink - Monitor
https://mp.weixin.qq.com/s/6e-G5RSQc7Xje7mQj8-Lag 简单介绍Monitor的实现. 1. 基本介绍用于监控各个channel上的 ...
js函数prototype属性学习（二）
继续探讨js对象的prototype属性,前面已经看到在创建完一个对象之后,随时都会有一个_proto_属性伴随所有,那么,这个_proto_又是用来干嘛的,面试时问的高大上的原型链又是怎么回事? 拿 ...
Java实现 LeetCode 440 字典序的第K小数字
440. 字典序的第K小数字给定整数 n 和 k,找到 1 到 n 中字典序第 k 小的数字. 注意:1 ≤ k ≤ n ≤ 109. 示例 : 输入: n: 13 k: 2 输出: 10 解释: ...
Java实现 LeetCode 420 强密码检验器
420. 强密码检验器一个强密码应满足以下所有条件: 由至少6个,至多20个字符组成. 至少包含一个小写字母,一个大写字母,和一个数字. 同一字符不能连续出现三次 (比如 "-aaa-&q ...
Java实现 LeetCode 417 太平洋大西洋水流问题
417. 太平洋大西洋水流问题给定一个 m x n 的非负整数矩阵来表示一片大陆上各个单元格的高度."太平洋"处于大陆的左边界和上边界,而"大西洋"处于大陆的 ...
第八届蓝桥杯JavaC组国(决)赛真题
解题代码部分来自网友,如果有不对的地方,欢迎各位大佬评论题目1.数位和题目描述数学家高斯很小的时候就天分过人.一次老师指定的算数题目是:1+2+-+100. 高斯立即做出答案:5050! 这次你 ...

Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 3. 浅层神经网络）

Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 3. 浅层神经网络）的更多相关文章

随机推荐

热门专题