V(t) = y*V(t-1) + learning_rate*G(x)

x(t) = x(t-1) - V(t)

参考：https://arxiv.org/pdf/1609.04747.pdf

DL训练面临的典型困难

普通的小批梯度下降法并不能保证很好的收敛性，但它提出了一些需要解决的挑战:选择合适的学习率可能是困难的。
学习速率过小会导致收敛速度过慢，而学习速率过大会阻碍收敛，导致损失函数在最小值附近波动甚至发散。
一种办法，可以在训练过程中调整学习率，例如退火，即根据预先定义的计划表减少学习率，或当各时期之间目标的变化低于阈值时。然而，这些进度表和阈值必须提前定义，因此不能适应数据集的特点，此外，相同的学习率适用于所有参数更新。如果我们的数据是稀疏的，并且我们的特征具有非常不同的频率，我们可能不希望将它们全部更新到相同的程度，而是对很少发生的特征就行更大的更新。
最小化神经网络中常见的高度非凸误差函数的另一个关键挑战是避免陷入大量次优局部极小值。Dauphin等人的[5]认为，这种困难实际上不是来自于局部极小值，而是来自鞍点，即一维向上、一维向下倾斜的点。这些鞍点通常被相同误差的平台所包围，这使得SGD很难逃脱，因为梯度在所有维度上都接近于零。

Mini-batch gradient descent

　　这是ML训练基本原理。一般不用直接梯度下降法就行训练

tf.train.GradientDescentOptimizer

Momentum（动量法）

更新公式如下，其中η为学习率（一般为0.9），用法：

tf.train.MomentumOptimizer

Nesterov accelerated gradient（NAG）

更新公式如下，用法：

Adaptive Moment Estimation (Adam)

tf.train.AdamOptimizer

主要DL Optimizer原理与Tensorflow相关API的更多相关文章

TensorFlow - 相关 API
来自:https://cloud.tencent.com/developer/labs/lab/10324 TensorFlow - 相关 API TensorFlow 相关函数理解任务时间:时间未 ...
TensorFlow — 相关 API
TensorFlow — 相关 API TensorFlow 相关函数理解任务时间:时间未知 tf.truncated_normal truncated_normal( shape, mean=0. ...
tensorflow相关API的学习
学习目录 1.tensorflow相关函数理解 (1)tf.nn.conv2d (2)tf.nn.relu (3)tf.nn.max_pool (4)tf.nn.dropout (5)tf.nn.si ...
[原创]java WEB学习笔记44：Filter 简介，模型，创建，工作原理，相关API，过滤器的部署及映射的方式，Demo
本博客为原创:综合尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和网络上的现有资源(博客,文档,图书等),资源的出处我会标明本博客的目的:①总结自己的学习过程,相当 ...
java 11 移除的一些其他内容，更简化的编译运行程序，Unicode 10，移除了不太使用的JavaEE模块和CORBA技术，废除Nashorn javascript引擎，不建议使用Pack200 相关api
移除的一些其他内容移除项移除了com.sun.awt.AWTUtilities 移除了sun.misc.Unsafe.defineClass, 使用java.lang.invoke.MethodH ...
Batch Normalization原理及其TensorFlow实现——为了减少深度神经网络中的internal covariate shift，论文中提出了Batch Normalization算法，首先是对”每一层“的输入做一个Batch Normalization 变换
批标准化(Bactch Normalization,BN)是为了克服神经网络加深导致难以训练而诞生的,随着神经网络深度加深,训练起来就会越来越困难,收敛速度回很慢,常常会导致梯度弥散问题(Vanish ...
开源框架---通过Bazel编译使用tensorflow c++ API 记录
开源框架---通过Bazel编译使用tensorflow c++ API 记录 tensorflow python API,在python中借用pip安装tensorflow,真的很方便,几句指令就完 ...
TensorFlow Keras API用法
TensorFlow Keras API用法 Keras 是与 TensorFlow 一起使用的更高级别的作为后端的 API.添加层就像添加一行代码一样简单.在模型架构之后,使用一行代码,可以编译和拟 ...
OpenGL FrameBufferCopy相关Api比较（glCopyPixels,glReadPixels,glCopyTexImage2D,glFramebufferTexture2D）
OpenGL FrameBufferCopy相关Api比较 glCopyPixels,glReadPixels,glCopyTexImage2D,glFramebufferTexture2D 标题所述 ...

随机推荐

又一本springmvc学习指南之---第22篇 springmvc 加载.xml文件的bean标签的过程
writedby 张艳涛,今天看spring mvc 学习指南的第2章,特意提下这个作者是how tomcat works 俩个作者之一, 喜欢上一本书的风格,使用案例来讲述原理, 在做第一个案例的时 ...
SaltStack 任意文件读写漏洞（CVE-2020-11652）
漏洞影响 SaltStack < 2019.2.4 SaltStack < 3000.2 同CVE-2020-11651 poc git clone https://github.com/ ...
关于vue3简单状态管理约定引发的思考
官方文档的代码是这样的 export const store = { debug: true, state: reactive({ message: 'Hello!' }), setMessageAc ...
.NET 6 预览版 7 发布——最后一个预览版
原文:bit.ly/2VJxjxQ 作者:Richard 翻译:精致码农-王亮说明:文中有大量的超链接,这些链接在公众号文章中被自动剔除,一部分包含超链接列表的小段落被我删减了,如果你对此感兴趣,请 ...
靶机CH4INRULZ_v1.0.1
nmap开路. root@kali:~# nmap -sP 192.168.1.* //拿到靶机地址192.168.1.8 root@kali:~# nmap -p- -sS -v -sV 192.1 ...
（2）用 if语句区间判断
1 /*此例子只作为演示*/ 2 3 #include <stdio.h> 4 int main() 5 { 6 printf("请问贵公司给出的薪资是:\n"); 7 ...
python自动化之(自动生成测试报告)
前言: 用python执行测试脚本, 测试报告是记录我们测试过程的问题, 方便我们对整个测试过程的把控. 这里引用的是别人写好的模板, 我们拿过来用就OK, 能力强者可自行编写模板测试报告图模板: ...
VNC远程重装CentOS7
适用于云服务器,远程安装纯净版的CentOS7.9 脚本执行完成后使用VNC客户端连接一键重装脚本 #!/bin/bash #Net Reinstall Centos System red='\03 ...
UNIX环境高级编程APUE练习3.2-不用fcntl实现dup2的功能
1 题面编写与dup2功能相同的函数,要求不调用fcntl函数,并且要有正确的出错处理. 2 基本思路不能用fcntl,能够返回一个文件描述符的只有open和dup.而open会创建一个新的文件表 ...
CSS 奇思妙想 | 使用 resize 实现强大的图片拖拽切换预览功能
本文将介绍一个非常有意思的功能,使用纯 CSS 利用 resize 实现强大的图片切换预览功能.类似于这样: 思路首先,要实现这样一个效果如果不要求可以拖拽,其实有非常多的办法. 将两张图片叠加在一 ...

主要DL Optimizer原理与Tensorflow相关API

DL训练面临的典型困难

Mini-batch gradient descent

Momentum（动量法）

Nesterov accelerated gradient（NAG）

Adaptive Moment Estimation (Adam)

主要DL Optimizer原理与Tensorflow相关API的更多相关文章

随机推荐

热门专题