从昨天晚上,到今天上午12点半左右吧,一直在调这个代码.最开始训练的时候,老是说loss:nan 查了资料,因为是如果损失函数使用交叉熵,如果预测值为0或负数,求log的时候会出错.需要对预测结果进行约束. 有一种约束方法是:y_predict=max(y,(0,1e-18]).也就是将小于0的数值随机分配为(0,1e-18]中的某个数.这样做好像不太合适. 还有一种方法是使用sigmoid作为激活函数.我这样改正了之后仍然没有效果. 后来我把数据集中的图片打开看了一下才发现,它跟mnist不一