1. 注意力模型 1.2 注意力模型概述 注意力模型(attention model)是一种用于做图像描述的模型.在笔记6中讲过RNN去做图像描述,但是精准度可能差强人意.所以在工业界,人们更喜欢用attention model. 结合下图,先简单地讲一下,注意力模型的运作原理. 第一步:进来一张图片 第二步:图片进入卷积神经网络,进行前向运算,将某个卷积层的结果输出.注意,上一个笔记中讲的RNN做图像描述,用的是全链接层的输出.至于说哪个层的输出好,没法下结论,这个需要去不同的场景中做实验比较…