好久不写了,几点这次项目经验吧,本次训练位多任务训练,主要目的训练人脸角度,具体公司项目不细谈. 讲一下主要碰到的坑: 1 最主要问题,网络结构不对称,导致主任务与辅助任务之间的梯度关系不平衡从而导致没法收敛!!!!真的是调参调的心都碎了,最后显示梯度发现这个问题 caffe显示梯度代码:https://blog.csdn.net/jyli2_11/article/details/74989852 其间做过的其他尝试: 1.1 先训练辅助任务, 采用SGD设置大学习率,辅助任务下降至符合要求以后…