Group Normalization 2018年03月26日 18:40:43 阅读数:1351 FAIR 团队,吴育昕和恺明大大的新作Group Normalization. 主要的优势在于,BN会受到batchsize大小的影响.如果batchsize太小,算出的均值和方差就会不准确,如果太大,显存又可能不够用. 而GN算的是channel方向每个group的均值和方差,和batchsize没关系,自然就不受batchsize大小的约束. 从上图可以看出,随着batchsize的减小,GN…