吴恩达深度学习：2.3梯度下降Gradient Descent

1.用梯度下降算法来训练或者学习训练集上的参数w和b，如下所示，第一行是logistic回归算法，第二行是成本函数J，它被定义为1/m的损失函数之和，损失函数可以衡量你的算法的效果，每一个训练样例都输出y，把它和基本真值标签y进行比较

右边展示了完整的公式，成本函数衡量了参数w和b在训练集上的效果。要找到合适的w和b，就很自然的想到，使得成本函数J(w,b)尽可能小的w和b

2.接下来看看梯度下降算法，下图中的横轴表示空间参数w和b，在实践中,w可以是更高维的，但是为了绘图的方便，我们让w是一个实数，b也是一个实数，成本函数J(w,b)是在水平轴w和b上的曲面，曲面的高度J(w,b)表示在某一点的值，我们所要做的就是找到这样的w和b，使其对应的成本函数J值是最小值，我们可以看到成本函数J是一个凸函数，就像这样的大碗，因此这是一个凸函数

和下面这个函数不一样，下面这个函数是非凸的，它有很不同的局部最优解

　　为了找到更好的参数值，我们要做的就是用某初始值初始化w和b值，对于logitstic回归而言，几乎任意的初始方法都有效，通常用0进行初始化。梯度下降算法就是从初始点开始，朝最陡的方向走一步，在梯度下降一步后，它可能停在那里，因为它正试图沿着最快下降的方向往下走或者说尽可能快的往下走，这就是梯度下降的一次迭代。

　　我们更新w，使得,在算法收敛之前，我们重复这样做，这里α表示学习率，可以控制每一次迭代或者梯度下降中的步长。无论从哪个方向来变化，梯度下降算法都会朝着全局最小值方向移动，

吴恩达深度学习：2.3梯度下降Gradient Descent的更多相关文章

【Deeplearning.ai 】吴恩达深度学习笔记及课后作业目录
吴恩达深度学习课程的课堂笔记以及课后作业代码下载:https://github.com/douzujun/Deep-Learning-Coursera 吴恩达推荐笔记:https://mp.weix ...
吴恩达深度学习第4课第3周编程作业 + PIL + Python3 + Anaconda环境 + Ubuntu + 导入PIL报错的解决
问题描述: 做吴恩达深度学习第4课第3周编程作业时导入PIL包报错．我的环境: 已经安装了Tensorflow GPU 版本 Python3 Anaconda 解决办法: 安装pillow模块,而不 ...
吴恩达深度学习第2课第2周编程作业的坑(Optimization Methods)
我python2.7, 做吴恩达深度学习第2课第2周编程作业 Optimization Methods 时有2个坑: 第一坑需将辅助文件 opt_utils.py 的 nitialize_param ...
吴恩达深度学习第1课第4周-任意层人工神经网络(Artificial Neural Network，即ANN)（向量化）手写推导过程（我觉得已经很详细了）
学习了吴恩达老师深度学习工程师第一门课,受益匪浅,尤其是吴老师所用的符号系统,准确且易区分．遵循吴老师的符号系统,我对任意层神经网络模型进行了详细的推导,形成笔记．有人说推导任意层MLP很容易,我 ...
深度学习吴恩达深度学习课程2第三周 tensorflow实践参数初始化的影响
博主撸的该节代码地址 :https://github.com/LemonTree1994/machine-learning/blob/master/%E5%90%B4%E6%81%A9%E8 ...
吴恩达深度学习反向传播（Back Propagation）公式推导技巧
由于之前看的深度学习的知识都比较零散,补一下吴老师的课程希望能对这块有一个比较完整的认识.课程分为5个部分(粗体部分为已经看过的): 神经网络和深度学习改善深层神经网络:超参数调试.正则化以及优化 ...
吴恩达深度学习笔记（deeplearning.ai）之循环神经网络（RNN）（三）
1. 导读本节内容介绍普通RNN的弊端,从而引入各种变体RNN,主要讲述GRU与LSTM的工作原理. 事先声明,本人采用ng在课堂上所使用的符号系统,与某些学术文献上的命名有所不同,不过核心思想都是 ...
吴恩达深度学习笔记（八） —— ResNets残差网络
(很好的博客:残差网络ResNet笔记) 主要内容: 一.深层神经网络的优点和缺陷二.残差网络的引入三.残差网络的可行性四.identity block 和 convolutional bloc ...
吴恩达深度学习笔记（十二）—— Batch Normalization
主要内容: 一.Normalizing activations in a network 二.Fitting Batch Norm in a neural network 三.Why does ...

随机推荐

以Emacs Org mode为核心的任务管理方案
前言如今用于任务管理的方法与工具越来越多,如纸笔系统.日历与任务列表.Emacs Org mode系统,以及移动设备上的诸多应用.这些解决方案各具特色,在一定程度上能够形成互补作用.但是,它们彼此之 ...
【canvas学习笔记七】混合和裁剪
globalCompositeOperation 如果我们先画了一个图形,然后要在这个图形上面再画一个图形,那么这个图形会怎么样呢?是覆盖在原来的图形上面吗?这时候,就要用到globalComposi ...
微信小程序登录 code 40029 天坑
微信登录时 code 大坑(服务端返回如下代码) {"errcode":40029,"errmsg":"invalid code, hints: [ ...
[BZOJ4010]:[HNOI2015]菜肴制作（拓扑排序）
题目传送门题目描述知名美食家小A被邀请至ATM大酒店,为其品评菜肴. ATM酒店为小A准备了N道菜肴,酒店按照为菜肴预估的质量从高到低给予1到N的顺序编号,预估质量最高的菜肴编号为1.由于菜肴之间 ...
使用Runnable接口创建线程池
步骤: 创建线程池对象创建 Runnable 接口子类对象提交 Runnable 接口子类对象关闭线程池实例: class TaskRunnable implements Runnable{ @Ove ...
1443：【例题4】Addition Chains
1443:[例题4]Addition Chains 题解注释在代码里注意优化搜索顺序以及最优化剪枝代码 #include<iostream> #include<cstdio&g ...
【洛谷P2016战略游戏】
树形dp的经典例题题目描述 Bob喜欢玩电脑游戏,特别是战略游戏.但是他经常无法找到快速玩过游戏的办法.现在他有个问题. 他要建立一个古城堡,城堡中的路形成一棵树.他要在这棵树的结点上放置最少数目的 ...
iOS常用加密之RSA加密解密
前言: iOS常用的加密有很多种,前两天在工作中遇到了RSA加密,现在把代吗分享出来. RSA基本原理 RSA使用"秘匙对"对数据进行加密解密.在加密解密数据前,需要先生成公钥(p ...
3、electron打包生成exe文件
打包方式1:DOS窗口命令打包 DOS 下,输入 npm install electron-packager -g全局安装我们的打包神器: cnpm install electron-packager ...
docker英语
demotevt. 使降级:使降职 promotevt. 促进:提升:推销:发扬 swarmn. 一大群:蜂群:人群:一大群小型天体同时在空中出现 worker 工人manager 经理swarm 人 ...

吴恩达深度学习：2.3梯度下降Gradient Descent

吴恩达深度学习：2.3梯度下降Gradient Descent的更多相关文章

随机推荐

热门专题