deeplearning.ai 神经网络和深度学习 week3 浅层神经网络听课笔记

1. 第i层网络 Z^[i] = W^[i]A^[i-1] + B^[i]，A^[i] = f^[i](Z^[i])。

其中， W^[i]形状是n^[i]*n^[i-1]，n^[i]是第i层神经元的数量；

A^[i-1]是第i-1层的神经元，形状是n^[i-1]*p，p是样本数量；

B^[i]形状是n^[i]*p，B^[i]的每一列都是一样的，所以其实有效的参数只是n^[i]个，python里直接用n^[i]*1的b^[i]然后boradcasting成n^[i]*p方便做加法。

A^[0]对应输入层，n^[0]是单个输入样本的特征数量。f^[i]()是第i层的激活函数。

Notation：a₄^[2](12)表示第2层，第12个样本，第4个神经元。

2. 永远不要用sigmoid函数，唯一的例外是二元分类问题的输出层，因为这需要输出是0或1。

tanh(z) = (e^z-e^(-z))/(e^z+e^(-z)) 作为激活函数几乎总比sigmoid函数效果好，直观地说是因为tanh的中心店是0而不像sigmoid是0.5，于是对于下一层有中心化数据的作用。

tanh和sigmoid函数的共同缺点是当输入很大或者很小时，函数会饱和，梯度为0。

ReLU是现在的默认选择，f(z) = max(0, z)。ReLU的收敛速度比tanh和sigmoid都要快得多。Leaky ReLU ( max(0.01z, z) )的表现更好一点，但是不明显，所以还是ReLU用的更多。

3. 为什么激活函数是必须的？如果没有激活函数，系统就成了只对输入做线性运算，内部的隐含层一点用也没有，网络层数再多也没用，因为线性函数的组合也是线性函数。

4. sigmoid σ(z) = 1/(1+e^(-z))，σ'(z) = σ(z)(1-σ(z)).

tanh g(z) = (e^z-e^(-z))/(e^z+e^(-z)) ，g'(z) = 1-(g(z))^2.

ReLU g(z) = max(0, z)，g'(z) = { 0 , if z<0;

{ 1, if z>0;

{ undefined, if z = 0. 实际使用中可以把这个点的导数设为0或者1，都无所谓。

5. 训练神经网络时，随机初始化权重W非常重要，全部设为0的话会使得梯度下降法无效，b可以初始化为0。

w[i] = np.random.randn((n^[i]，n^[i-1]))*0.01. 乘以0.01是为了把它初始化成很小的随机数，因为对于tanh、sigmoid类似的函数，权重太大容易饱和。如果不用tanh、sigmoid，用ReLU，那么问题不大，但如果最终是个二分类问题，最后一个输出还是用了sigmoid，那么还会遇到这个问题。所以干脆全部初始化成很小的随机数吧。对于浅层神经网络，一般这种初始化方法就ok了。但对于很深的神经网络，有时候要挑选0.01以外的常数。

b[i] = np.zero((n^[i], 1))。

　但对于Logistic回归来说，并没有隐含层，所以是可以把W和b都初始化为0的。这样初始化的时候，第一次前向计算的输出确实是0，但是反向传播计算的梯度值是和输入相关的，所以不同的神经元会有不同的值，破坏了对称性，所以算法有效。

6. 神经网络算法的一般流程：

　　1）定义神经网络的结构：输入的大小，隐藏层层数，每层神经元的数量，等等。

　　2）初始化参数，W初始化为小随机数，b初始化为0。

　　3）循环：

　　　　a）前向传播，对于第[i]层网络，已知前一层传进来的输入A^[i-1]，和这一层的参数W^[i]、b^[i]，以及激活函数，计算出Z^[i]和A^[i]，并且把Z^[i]、A^[i]、W^[i]保存起来为反向传播的计算做准备。

　　　　b）计算loss。

　　　　c）反向传播得到梯度，对于第[i]层网络，已知后一层传来的输入dA^[i]，从cache中取出Z^[i]、A^[i]、W^[i]，计算出dW^[i]、db^[i]、dA^[i-1]。

　　　　d）更新参数。

deeplearning.ai 神经网络和深度学习 week3 浅层神经网络听课笔记的更多相关文章

deeplearning.ai 神经网络和深度学习 week3 浅层神经网络
1. 第i层网络 Z[i] = W[i]A[i-1] + B[i],A[i] = f[i](Z[i]). 其中, W[i]形状是n[i]*n[i-1],n[i]是第i层神经元的数量: A[i-1]是第 ...
DeepLearning.ai学习笔记（一）神经网络和深度学习--Week3浅层神经网络
介绍 DeepLearning课程总共五大章节,该系列笔记将按照课程安排进行记录. 另外第一章的前两周的课程在之前的Andrew Ng机器学习课程笔记(博客园)&Andrew Ng机器学习课程 ...
[DeeplearningAI笔记]神经网络与深度学习2.11_2.16神经网络基础(向量化)
觉得有用的话,欢迎一起讨论相互学习~Follow Me 2.11向量化向量化是消除代码中显示for循环语句的艺术,在训练大数据集时,深度学习算法才变得高效,所以代码运行的非常快十分重要.所以在深度学 ...
deeplearning.ai 构建机器学习项目 Week 2 机器学习策略 II 听课笔记
1. 误差分析(Error analysis) 误差分析的目的是找到不同误差源的比重,从而指引我们接下来往哪个方向努力改进.NG建议手工统计随机100个错误的误差源,比如对于猫分类器,错误的照片可能是 ...
deeplearning.ai 构建机器学习项目 Week 1 机器学习策略 I 听课笔记
这门课是讲一些分析机器学习问题的方法,如何更快速高效的优化机器学习系统,以及NG自己的工程经验和教训. 1. 正交化(Othogonalization) 设计机器学习系统时需要面对一个问题是:可以尝试 ...
Andrew Ng - 深度学习工程师 - Part 1. 神经网络和深度学习（Week 2. 神经网络基础）
=================第2周神经网络基础=============== ===2.1 二分分类=== ===2.2 logistic 回归=== It turns out, whe ...
[DeeplearningAI笔记]神经网络与深度学习2.1-2.4神经网络基础
觉得有用的话,欢迎一起讨论相互学习~Follow Me 2.1 二分分类在二分分类问题中,目标是训练出一个分类器,它以图片的特征向量x作为输入,预测输出的结果标签y是1还是0.在图像识别猫图片的例子 ...
对比《动手学深度学习》 PDF代码+《神经网络与深度学习》PDF
随着AlphaGo与李世石大战的落幕,人工智能成为话题焦点.AlphaGo背后的工作原理"深度学习"也跳入大众的视野.什么是深度学习,什么是神经网络,为何一段程序在精密的围棋大赛中 ...
Deeplearning.ai课程笔记-神经网络和深度学习
神经网络和深度学习这一块内容与机器学习课程里Week4+5内容差不多. 这篇笔记记录了Week4+5中没有的内容. 参考笔记:深度学习笔记神经网络和深度学习结构化数据:如数据库里的数据非结构化数 ...

随机推荐

《TCP-IP详解卷2：实现》【PDF】下载
<TCP-IP详解卷2:实现>[PDF]下载链接: https://u253469.pipipan.com/fs/253469-230062539 内容简介 <TCP/IP详解·卷2 ...
DotNetCore跨平台~功能测试TestHost的使用
回到目录之前写了关于自动化测试的相关文章,包括gitlab,unittest,jenkins pipeline等,基于都是功能点的测试,当我们的框架或者业务修改之后,需要走一篇自动化测试,以此来保证 ...
Python3入门笔记（1） —— windows安装与运行
Python的设计哲学是"优雅"."明确"."简单".这也是我喜欢Python的理由之一 Python的安装: 1.进入Python官方网站 ...
S7-200和S7-300profibus-DP通信
一.S7-200CN的cup可以通过EM277接入DP网络二.CPU315-2DP做主站,S7-200CUP做从站三. 通信题目四.硬件组态 1.主站的DP组态,地址为2 2.EM277作为从站 ...
ES6常用语法
ECMAScript 6(以下简称ES6)是JavaScript语言的下一代标准.因为当前版本的ES6是在2015年发布的,所以又称ECMAScript 2015. 也就是说,ES6就是ES2015. ...
DeepLearning.ai学习笔记（三）结构化机器学习项目--week2机器学习策略(2)
一.进行误差分析很多时候我们发现训练出来的模型有误差后,就会一股脑的想着法子去减少误差.想法固然好,但是有点headlong~ 这节视频中吴大大介绍了一个比较科学的方法,具体的看下面的例子还是以猫 ...
css3 UI元素状态伪类选择器
选择器说明例子/备注 E:hover 当鼠标移到元素上元素所使用的样式 :hover{}或input:[type="text"]:hover{} E:active 当元素被激活 ...
HTML基本功之文档结构
项目名首页命名为 index.html 样式文件夹命名为 css /*用来放样式文件*/ base.css /*基本样式*/ index.css /*首页样式*/ global.css /* ...
Golang 网络爬虫框架gocolly/colly 二 jQuery selector
Golang 网络爬虫框架gocolly/colly 二 jQuery selector colly框架依赖goquery库,goquery将jQuery的语法和特性引入到了go语言中.如果要灵活自如 ...
QT中定时器的使用方法
前言:因为QT中用死循环会开销很多内存容易崩溃,这时候使用定时器可以很好解决这个问题. 使用定时器需要用到头文件:include<QTimer> (1)定义定时器 QTimer *upda ...

deeplearning.ai 神经网络和深度学习 week3 浅层神经网络 听课笔记

deeplearning.ai 神经网络和深度学习 week3 浅层神经网络 听课笔记的更多相关文章

随机推荐

热门专题

deeplearning.ai 神经网络和深度学习 week3 浅层神经网络听课笔记

deeplearning.ai 神经网络和深度学习 week3 浅层神经网络听课笔记的更多相关文章