我做的是一个识别验证码的深度学习模型,识别的图片如下 验证码图片识别4个数字,数字间是有顺序的,设立标签时设计了四个onehot向量链接起来,成了一个长度为40的向量,然后模型的输入也是40维向量用softmax_cross_entropy_with_logits(labels=,logits=)函数计算输出与标签的损失,发现损失值一直在增大,直到nan.然后打印了输出值,发现也是很大.觉得是梯度爆炸的原因,用梯度裁剪.限制权重值等方法一通结束之后发现根本没什么改变.最后只放入两张图片,发现模型…