machine learning (5)---learning rate

degugging:make sure gradient descent is working correctly

cost function(J(θ)) of Number of iteration ：cost function随着迭代次数增加的变化函数
运行错误的图象是什么样子的：cost function(J(θ)) of Number of iteration随着迭代次数增加而上升(如以下两种图像的情况)，应使用较小的learning rate
运行正确的图象是什么样子的：cost function(J(θ)) of Number of iteration应该是递减的并且随着迭代次数增加它趋于一条平缓的曲线（即收敛于一个固定的值）

how to choose learning rate(∂)
1. 若learning rate太小: 收敛速度会很慢
2. 若learning rate太大： gradient descent不会收敛，会出现随着迭代次数的增加，cost function反而变大的情况，这时我们要选择较小的learning rate去尝试。
3. 可供选择的一些learning rate值: 0.3, 0.1, 0.03, 0.01 and so on(3倍)
4. 在进行gradient drscent时，我们会尝试一些不同的learning rate,然后绘制出不同的ost function(J(θ)) of Number of iteration曲线，然后选择一个使cost function 快速下降的learning rate.
5. 如何选择最佳的learning rate

尝试这些不同的learning rate找到一个最大的learning rate（若再大则不会收敛）或者比最大稍小一点的learning rate

machine learning (5)---learning rate的更多相关文章

Machine and Deep Learning with Python
Machine and Deep Learning with Python Education Tutorials and courses Supervised learning superstiti ...
Machine Learning—Online Learning
印象笔记同步分享:Machine Learning-Online Learning
What are some good books/papers for learning deep learning?
What's the most effective way to get started with deep learning? 29 Answers Yoshua Bengio, ...
（转）Paper list of Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning
Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning 2018-08-03 19:16:56 本文转自:http ...
(转) Learning Deep Learning with Keras
Learning Deep Learning with Keras Piotr Migdał - blog Projects Articles Publications Resume About Ph ...
增强学习（五）----- 时间差分学习(Q learning, Sarsa learning)
接下来我们回顾一下动态规划算法(DP)和蒙特卡罗方法(MC)的特点,对于动态规划算法有如下特性: 需要环境模型,即状态转移概率\(P_{sa}\) 状态值函数的估计是自举的(bootstrapping ...
Zero-shot Learning / One-shot Learning / Few-shot Learning
Zero-shot Learning / One-shot Learning / Few-shot Learning Learning类型:Zero-shot Learning.One-shot Le ...
[Machine Learning] Active Learning
1. 写在前面在机器学习(Machine learning)领域,监督学习(Supervised learning).非监督学习(Unsupervised learning)以及半监督学习(Semi ...
Machine Learning——Supervised Learning（机器学习之监督学习）
监督学习是指:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程. 我们来看一个例子:预测房价(注:本文例子取自业界大牛吴恩达老师的机器学习课程) 如下图所示:横轴表示房子的面积,单位是 ...

随机推荐

学习数据结构Day4
链表之前看过了动态数组,栈和队列,虽然我们把第一个叫做动态数组,但是,他们的底层实质上还是静态数组.靠 resize来实现动态数组.而链表是真正的数据结构链表需要一个节点. 数据存储在链表中相当 ...
ES6新增的一些特性
1.let关键字,用来代替 var的关键字,特点: 1.变量不允许被重复定义 2.不会进行变量声明提升 3.保留块级作用域中i的 2.const定义常量,特点:1.常量值不允许被改变 2.不会进行变量 ...
[转帖]IBM报告：多国央行考虑发行数字货币最快5年内问世
IBM报告:多国央行考虑发行数字货币最快5年内问世 https://news.cnblogs.com/n/646001/ DCEP 中国央行可能是第一家发布数字货币的央行 DCEP 是基于 UTX ...
day36——死锁、递归锁、信号量、GIL、多线程实现socket通信、线程池和进程池
day36 死锁现象与递归锁死锁现象是指两个或两个以上的进程或线程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去.此时称系统处于死锁状态或系统产生了死锁,这 ...
Codeblocks中文乱码解决方法。
如需安装包请后台留言!! Codeblocks中文乱码解决方法: 特别提示:出现中文乱码情况才执行以下操作,未出现请勿随意修改!!!! 打开Codeblocks -> 设置 -> 编辑器: ...
Python Django 协程报错,进程池、线程池与异步调用、回调机制
一.问题描述在Django视图函数中,导入 gevent 模块 import gevent from gevent import monkey; monkey.patch_all() from ge ...
matlab安装与使用
Matlab安装和使用百度网盘连接:https://pan.baidu.com/s/1aHPeAkNofCuwyYopnva4Mg 提取码:ci96 下载完成后: 将R2017b_win64_dvd ...
Java Web 深入分析（11） JVM(1)
前言 Java启动后作为一个进程运行在操作系统中,该进程要分配的内存有以下几个: 1.Java堆: 存储java内存区域,堆大小是在jvm启动时就像操作系统申请完成,其中 -Xmx和-Xms 分别表示 ...
DateTimePicker控件CustomFormat格式字符串及其说明
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/wuzhanwen/article/details/78800720格式字符串描述 d 一个或两位数 ...
'adb' 不是内部或外部命令，也不是可运行的程序或批处理文件—解决方法
Windows键 + R → 输入cmd → 输入adb,提示“adb不是内部或外部命令,也不是可运行的程序或批处理文件“,错误信息如下: 解决方法: 此电脑(右击)→ 属性 → 高级系统设置 → ...

machine learning (5)---learning rate

machine learning (5)---learning rate的更多相关文章

随机推荐

热门专题