在传统的神经网络中,比如多层感知机(MLP),其输入通常是一个特征向量.需要人工设计特征,然后将用这些特征计算的值组成特征向量.在过去几十年的经验来看,人工找的特征并不总是好用.有时多了,有时少了,有时选的特征根本就不起作用(真正起作用的特征在浩瀚的未知里).这就是为啥过去几十年神经网络一直被SVM等完虐的原因. 如果有人说,任何特征都是从图像中提取的.那如果把整幅图像作为特征来训练神经网络不就行了嘛,那肯定不会有任何的信息丢失!额,先不说一幅图像有多少冗余信息,单说这数据量就,吓死了! 假如有