深度学习调参笔记（trick）

1. Adam 学习率0.00035真香；

2. SGD + Momentum 学习率应当找到合适区间，一般远大于Adam (取1,2,5,10这类数据)；

3. 提前终止，防止过拟合;

4. Ensemble可以显著提高模型性能，对两个模型而言，适当增加性能较好的模型权重可能会取得更好的结果；

5. 随机擦除 https://www.ctolib.com/albumentations-team-albumentations.html#articleHeader7 ；

class albumentations.augmentations.transforms.CoarseDropout(max_holes=8, max_height=8, max_width=8, min_holes=None, min_height=None, min_width=None, fill_value=0, always_apply=False, p=0.5)

6. 测试时取原图与数据增强图片（如翻转）的均值；

7. Ranger优化器(RAdam+LookAhead)；

Ranger: https://github.com/lessw2020/Ranger-Deep-Learning-Optimizer

RAdam: https://github.com/LiyuanLucasLiu/RAdam

8. 加入BN层，可以防止过拟合；

9. ResNet系列，将最后一个block步长（stride）改成1可以提高性能（识别任务等）；

10. warm up一般用于Adam，可以基于batch与epoch进行warm up；

11. 惩罚高置信度错误分类（0.999 >>> 0.9, 0.001 >>> 0.1）；

深度学习调参笔记（trick）的更多相关文章

深度学习Keras框架笔记之AutoEncoder类
深度学习Keras框架笔记之AutoEncoder类使用笔记 keras.layers.core.AutoEncoder(encoder, decoder,output_reconstruction= ...
深度学习Keras框架笔记之TimeDistributedDense类
深度学习Keras框架笔记之TimeDistributedDense类使用方法笔记例: keras.layers.core.TimeDistributedDense(output_dim,init= ...
深度学习Keras框架笔记之Dense类(标准的一维全连接层)
深度学习Keras框架笔记之Dense类(标准的一维全连接层) 例: keras.layers.core.Dense(output_dim,init='glorot_uniform', activat ...
LightGBM调参笔记
本文链接:https://blog.csdn.net/u012735708/article/details/837497031. 概述在竞赛题中,我们知道XGBoost算法非常热门,是很多的比赛的大杀 ...
scikit-learn 梯度提升树(GBDT)调参笔记
在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit-learn里GBDT的类库使用方法作一个总结,主要会关注调参中的一些要点. 1. scikit-learn ...
深度学习-TensorFlow2.0笔记（一）
一.Tensor 1.1 什么是Tensor?Tensor的数据类型 Tensor是张量的意思,在TensorFlow中张量可以是标量(scalar).向量(vector).矩阵(matrix).高维 ...
《动手学深度学习》系列笔记—— 1.2 Softmax回归与分类模型
目录 softmax的基本概念交叉熵损失函数模型训练和预测获取Fashion-MNIST训练集和读取数据 get dataset softmax从零开始的实现获取训练集数据和测试集数据模型参 ...
深度学习-CNN+RNN笔记
以下叙述只是简单的叙述,CNN+RNN(LSTM,GRU)的应用相关文章还很多,而且研究的方向不仅仅是下文提到的1. CNN 特征提取,用于RNN语句生成图片标注.2. RNN特征提取用于CNN内容分 ...
deeplearning.ai 神经网络和深度学习 week1 深度学习概论听课笔记
1. 预测房价.广告点击率:典型的神经网络,standard NN. 图像:卷积神经网络,CNN. 一维序列数据,如音频,翻译:循环神经网络,RNN. 无人驾驶,涉及到图像.雷达等更多的数据类型:混合 ...

随机推荐

kylin streaming原理介绍与特点浅析
目录前言 kylin streaming设计和原理架构介绍 streaming coordinator streaming receiver cluster kylin streaming数据构建 ...
Web压测工具之Webbench和http_load
Webbench简介是知名的网站压力测试工具,能测试处在相同硬件上,不同服务的性能以及不同硬件上同一个服务的运行状况. webbench的标准测试可以向我们展示服务器的两项内容:每秒钟相应请求数和每 ...
java反序列化——apache-shiro复现分析
本文首发于“合天智汇”公众号作者:Fortheone 看了好久的文章才开始分析调试java的cc链,这个链算是java反序列化漏洞里的基础了.分析调试的shiro也是直接使用了cc链.首先先了解一些 ...
PHP strchr() 函数
实例查找 "world" 在 "Hello world!" 中的第一次出现,并返回字符串的其余部分: <?php高佣联盟 www.cgewang.com ...
JDBC(1)-数据库连接和CRUD操作
关于jdbc的全部jar包链接:https://pan.baidu.com/s/1peofgu89SpepTTYuZuphNw 提取码:vd5v 一.获取数据库连接 1. Driver接口介绍 ja ...
Blob分析之 ball.hdev
* ball.hdev: Inspection of Ball Bonding * 关闭窗体更新 dev_update_window ('off')*关闭窗体dev_close_window ()*打 ...
Jvm相关文章
深入理解JVM-内存模型(jmm)和GC https://www.jianshu.com/p/76959115d486
【av68676164（p55-p58)】 Intel CPU和Linux内存管理
7.4.1 Intel CPU物理结构 https://www.cnblogs.com/megachen/p/9768115.html x86实模式实模式 20位:1M内存空间地址表示方式:段地址 ...
Java高级篇 JVM
JVM是什么? JVM起了什么作用? JVM包含了什么? JVM中, 一个类程序是怎么加载的? JVM中垃圾回收机制?
MyBatisPlus乐观锁,乐观锁竟然如此简单
乐观锁在便是过程中,我们经常会被问到乐观锁,悲观锁,都非常简单乐观锁:顾名思义,思想十分乐观,总是认为不会出现问题,无论什么都不去上锁!如果出现了问题,就再更新测试悲观锁:顾明思义,思想十分悲观 ...

深度学习调参笔记（trick）

深度学习调参笔记（trick）的更多相关文章

随机推荐

热门专题