Hierarchical Attention Networks for Document Classification 论文的理解 在论文的摘要中,它提出了论文的两个特点.第一个就是对应文章所有具有的分层结构,这个模型采取了相应的分层结构.这个文章的分层结构怎么理解呢? 文章是具有分层结构的,单词构成了句子,句子构成了文章.根据这个结构,HAN提出了在表示文章的时候,先是在第一层得到句子的表示,然后在第二层得到文章的表示.(这句话 可能有点费解,这个结构在第一层使用的是单词向量,所以在第一层最后…