现在的CNN还差很多,未来满是变数. 你看,现在的应用领域也无非merely就这么几类----分类识别,目标检测(定位+识别),对象分割......,但是人的视觉可不仅仅这么几个功能啊!是吧. 先说说CNN中的C,convolution,卷积.从1998年lecun的LEnet到后来alexnet,vgg16,googlenet以及何恺明老师的resnet都是在卷积的基础上搞的.卷积是什么,就是用一个抽象出某种特定特征的矩阵去部分连接乘以我们的图像矩阵,然后输出一个矩阵,输出的矩阵则包含了图像对…