BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结

https://blog.csdn.net/liuxiao214/article/details/81037416

http://www.dataguru.cn/article-13032-1.html

1. BatchNormalization

实现时，对axis = 0维度求均值和方差 -> 对一个batch求均值和方差

(Tensorflow代码)

 def Batchnorm_simple_for_train(x, gamma, beta, bn_param):

 """

 param:x    : 输入数据，设shape(B,L)

 param:gama : 缩放因子  γ

 param:beta : 平移因子  β

 param:bn_param   : batchnorm所需要的一些参数

     eps      : 接近0的数，防止分母出现0

     momentum : 动量参数，一般为0.9， 0.99， 0.999

     running_mean ：滑动平均的方式计算新的均值，训练时计算，为测试数据做准备

     running_var  : 滑动平均的方式计算新的方差，训练时计算，为测试数据做准备

 """

     running_mean = bn_param['running_mean']  #shape = [B]

     running_var = bn_param['running_var']    #shape = [B]

     results = 0. # 建立一个新的变量

     x_mean=x.mean(axis=0)  # 计算x的均值

     x_var=x.var(axis=0)    # 计算方差

     x_normalized=(x-x_mean)/np.sqrt(x_var+eps)       # 归一化

     results = gamma * x_normalized + beta            # 缩放平移

     running_mean = momentum * running_mean + (1 - momentum) * x_mean

     running_var = momentum * running_var + (1 - momentum) * x_var

     #记录新的值

     bn_param['running_mean'] = running_mean

     bn_param['running_var'] = running_var 

     return results , bn_param

2. LayerNormaliztion

实现时，对axis = 1维度求均值和方差 -> 对一个样例的所有features的值求均值和方差

(Pytorch 代码，来自The Annotated Transformer)

 class LayerNorm(nn.Module):

     "Construct a layernorm module (See citation for details)."

     def __init__(self, features, eps=1e-6):

         super(LayerNorm, self).__init__()

         self.a_2 = nn.Parameter(torch.ones(features))

         self.b_2 = nn.Parameter(torch.zeros(features))

         self.eps = eps

     def forward(self, x):

         mean = x.mean(-1, keepdim=True)

         std = x.std(-1, keepdim=True)

         return self.a_2 * (x - mean) / (std + self.eps) + self.b_2

BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结的更多相关文章

深度学习中的Normalization模型
Batch Normalization(简称 BN)自从提出之后,因为效果特别好,很快被作为深度学习的标准工具应用在了各种场合.BN 大法虽然好,但是也存在一些局限和问题,诸如当 BatchSize ...
[优化]深度学习中的 Normalization 模型
来源:https://www.chainnews.com/articles/504060702149.htm 机器之心专栏作者:张俊林 Batch Normalization (简称 BN)自从提出 ...
BatchNormalization的使用
# import BatchNormalization from keras.layers.normalization import BatchNormalization # instantiate ...
BatchNormalization批量归一化
动机: 防止隐层分布多次改变,BN让每个隐层节点的激活输入分布缩小到-1和1之间. 好处: 缩小输入空间,从而降低调参难度:防止梯度爆炸/消失,从而加速网络收敛. BN计算公式: keras.laye ...
batch-normalization为什么效果好
batch-normalization为什么效果好深度学习中 Batch Normalization为什么效果好? - 龙鹏-言有三的回答 - 知乎 https://www.zhihu.com/qu ...
torch_12_dataset和dataLoader，Batchnormalization解读
参考博客https://blog.csdn.net/qq_36556893/article/details/86505934 深度学习入门之pytorch https://github.com/L1a ...
Inception系列之Batch-Normalization
训练深度神经网络非常复杂,因为在训练过程中,随着先前各层的参数发生变化,各层输入的分布也会发生变化,图层输入分布的变化带来了一个问题,因为图层需要不断适应新的分布,因此训练变得复杂,随着网络变得更深, ...
keras BatchNormalization 之坑
任务简述:最近做一个图像分类的任务, 一开始拿vgg跑一个baseline,输出看起来很正常: 随后,我尝试其他的一些经典的模型架构,比如resnet50, xception,但训练输出显示明显异常: ...
深度学习中 --- 解决过拟合问题（dropout, batchnormalization）
过拟合,在Tom M.Mitchell的<Machine Learning>中是如何定义的:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h’属于H,使得在训练样例上h的错误率比 ...

随机推荐

redis配置文档细节问题
在window10环境下,redis的.conf配置文件在使用时,不可以有多余的空白符.比如为了对其在配置的前方添加两个空格. 这么做会导致redis-server使用这个配置文件的时候无法正常启动, ...
自动生成ID
public class IdUtil { /** * * @return 返回时间id,类似于20191217195622 */ public static String timeId(){ Dat ...
Postman之简单使用
前提:已获得接口文档 / 抓包数据 1.启动Postman 直接在这个页面输入数据(不用管其他的地方!!!) 2.按照接口文档填入注意蓝色框中的数据请求方式:POST(几乎都是使用POST/GET ...
Codeforces 1190D. Tokitsukaze and Strange Rectangle
传送门注意到矩形往上是无限的,考虑把点按 $y$ 从大到小考虑对于枚举到高度为 $h$ 的点,设当前高度大于等于 $h$ 的点的所有点的不同的 $x$ 坐标数量为 $cnt$ 那么对于这一层高度 ...
pytorch中的torch.repeat()函数与numpy.tile()
repeat(*sizes) → Tensor Repeats this tensor along the specified dimensions. Unlike expand(), this fu ...
AngularJs 初级入门学习笔记
刚学angular, 做一些笔记方便自己翻看. ng-app: 填写模块的名称 ng-init: 初始化数据(一般通过控制器初始化) ng-model: 填写数据模型 ng-bind: 绑定数据模型, ...
5.（基础）tornado异步
终于到了传说中的异步了,感觉异步这个名字听起来就很酷酷的,以前还不是多擅长Python时,就跑去看twisted的源码,结果给我幼小的心灵留下了创伤.反正包括我在内,都知道异步编程很强大,但是却很少在 ...
00：Java简单了解
浅谈Java之概述 Java是SUN(Stanford University Network),斯坦福大学网络公司)1995年推出的一门高级编程语言.Java是一种面向Internet的编程语言.随着 ...
四，k8s集群资源清单定义入门
目录资源对象创建资源的方法清单帮助命令创建测试清单资源的三种创建方式资源对象 workload:Pod, ReplicaSet, Deployment, StatefulSet, Daem ...
U-boot新手入门，烧写进mini2440
拿到一块开发板,首先就要找到它的资料,当然了,开发板的厂商或者代理商会提供资料,资料里会有你需要的. 比如我的这块mini2440,在友善之臂代理商提供的资料里面,就有我们这篇所需要的把这个文件夹下 ...

BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结

1. BatchNormalization

2. LayerNormaliztion

BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结的更多相关文章

随机推荐

热门专题