TensorFlow笔记之常见七个参数

对TensorFlow深度学习中常见参数的总结分析

　　神经网络中常见的参数有：初始学习率、学习率衰减率、隐藏层节点数量、迭代轮数、正则化系数、滑动平均衰减率、批训练数量七个参数。　　对这七个参数，大部分情况下，神经网络的参数选优是通过实验来调整的。　　一个想法是，通过测试数据来评判参数的效果，但是这种方法会导致过拟合测试数据，失去评判未知数据的意义。而我们训练神经网络的目的，恰恰是为了预测未知数据。　　所以，为了评判各种参数的效果，一般会从训练数据中抽取一部分作为验证数据。　　验证数据的选取方法也是非常重要的，一般来说选取的验证数据分布越接近测试数据分布，模型在验证数据上的表现越可以体现模型在测试数据上的表现。

不同参数模型的效果比较

　　以前提到过，设计神经网络时候的5种优化方法。一个是神经网络结构设计上，需要使用激活函数和多层隐藏层；另一个是，神经网路优化时，可以使用指数衰减的学习率、加入正则化的损失函数、滑动平均模型。　　影响最大的是：调整神经网络的结构，包括隐藏层和激活函数。这说明， 神经网络的结构对最终模型的效果有本质影响。　　另外的，滑动平均模型、指数衰减率和正则化项对正确率的提升并不是特别明显。这是因为滑动平均模型和指数衰减的学习率在一定程度上都是限制神经网络中参数更新的速度。如果模型的收敛速度很快，这两种优化对最终模型的影响不大。　　这两个个优化手段，能否说优化作用不大呢？　　其实不是的。当问题更加复杂时，迭代不会这么快接近收敛，这时候滑动平均模型和指数衰减的学习率可以发挥更大的作用。　　还有一个正则化项，对模型效果带来的提升要相对显著。使用了正则化项损失函数的神经网络模型可以降低大约6%的错误率。　　只优化交叉熵的模型可以更好的拟合训练数据（交叉熵损失更小），但是却不能很好的挖掘数据中潜在的规律来判断未知的测试数据，所以在测试数据上正确率低。

　　总结一下的话，激活函数和隐藏层对模型的效果带来质的飞跃；滑动平均模型、学习率衰减率、正则化项对最终正确率的提升效果不明显，但是需要解决的问题和使用的神经网络更加复杂时，这些优化方法将更有可能对训练效果产生更大的影响。

TensorFlow笔记之常见七个参数的更多相关文章

tensorflow笔记（一）之基础知识
tensorflow笔记(一)之基础知识版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7399701.html 前言这篇no ...
tensorflow笔记（三）之 tensorboard的使用
tensorflow笔记(三)之 tensorboard的使用版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7429344.h ...
tensorflow笔记（四）之MNIST手写识别系列一
tensorflow笔记(四)之MNIST手写识别系列一版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
tensorflow笔记（五）之MNIST手写识别系列二
tensorflow笔记(五)之MNIST手写识别系列二版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...
tensorflow笔记：多层LSTM代码分析
tensorflow笔记:多层LSTM代码分析标签(空格分隔): tensorflow笔记 tensorflow笔记系列: (一) tensorflow笔记:流程,概念和简单代码注释 (二) ten ...
深度学习Bible学习笔记：第七章深度学习中的正则化
一.正则化介绍问题:为什么要正则化? NFL(没有免费的午餐)定理: 没有一种ML算法总是比别的好好算法和坏算法的期望值相同,甚至最优算法跟随机猜测一样前提:所有问题等概率出现且同等重要实际并 ...
TensorFlow笔记-08-过拟合,正则化,matplotlib 区分红蓝点
TensorFlow笔记-08-过拟合,正则化,matplotlib 区分红蓝点首先提醒一下,第7讲的最后滑动平均的代码已经更新了,代码要比理论重要今天是过拟合,和正则化,本篇后面可能或更有兴趣, ...
TensorFlow笔记-07-神经网络优化-学习率,滑动平均
TensorFlow笔记-07-神经网络优化-学习率,滑动平均学习率学习率 learning_rate: 表示了每次参数更新的幅度大小.学习率过大,会导致待优化的参数在最小值附近波动,不收敛:学习 ...
TensorFlow笔记-06-神经网络优化-损失函数,自定义损失函数,交叉熵
TensorFlow笔记-06-神经网络优化-损失函数,自定义损失函数,交叉熵神经元模型:用数学公式比表示为:f(Σi xi*wi + b), f为激活函数神经网络是以神经元为基本单位构成的激 ...

随机推荐

phpcms调用语句
title 标题:url 链接地址:thumb缩略图 :先调用moreinfo="1" content 内容: {php list($copyfrom) = explode('| ...
ros有一个比较安全的登录方案：二次登录防火墙
原文: https://www.winbox.org/ /ip firewall address-list add address=10.0.0.0/8 list=login /ip firewall ...
python导入requests库一直报错原因总结（文件名与库名冲突）
花了好长时间一直在搞这个源代码: 一直报如下错误: 分析原因: 总以为没有导入requests库,一直在网上搜索各种的导入库方法(下载第三方的requests库,用各种命令工具安装),还是报错后来 ...
20145319 《网络渗透》MS08_067安全漏洞
20145319 <网络渗透>MS08_067安全漏洞一实验内容了解掌握metasploit平台的一些基本操作,能学会利用已知信息完成简单的渗透操作了解漏洞MS08_067的相关知 ...
用GDB调试程序（七）
改变程序的执行——————— 一旦使用GDB挂上被调试程序,当程序运行起来后,你可以根据自己的调试思路来动态地在GDB中更改当前被调试程序的运行线路或是其变量的值,这个强大的功能能够让你更好的调试你的 ...
[java,2017-05-04] 创建word文档
package test; import java.text.SimpleDateFormat; import java.util.Date; import com.aspose.words.Data ...
SHFileOperation 解决double-null terminated
void rubyTools::funStrToWstr(string str, wstring& strw) { const char* pData = str.c_str(); int l ...
微信小程序版本管理
备忘录:<需要修改完善> 打开小程序开发者工具,点击版本管理,点击设置 , 通用更改码云的名字和邮箱网络认证选择用户名和密码把密码输入了,点击远程添加输入码云的https地址和仓 ...
python读取excel表
from xlrd import open_workbookimport re #创建一个用于读取sheet的生成器,依次生成每行数据,row_count 用于指定读取多少行, col_count 指 ...
stm32 HAL库笔记（一）——普通IO口
今天介HAL库操作普通IO口,就是输入/输出. 如果用CubeMX配置io工程,打开以后可以看到如下代码: GPIO_InitTypeDef GPIO_Initure; __HAL_RCC_GPIOB ...

TensorFlow笔记之常见七个参数

TensorFlow笔记之常见七个参数的更多相关文章

随机推荐

热门专题