卷积神经网络用语句子分类---Convolutional Neural Networks for Sentence Classification 学习笔记

　　读了一篇文章，用到卷积神经网络的方法来进行文本分类，故写下一点自己的学习笔记：

　　本文在事先进行单词向量的学习的基础上，利用卷积神经网络（CNN）进行句子分类，然后通过微调学习任务特定的向量，提高性能。

　　在从无监督神经语言模型中获得单词向量(Tomas Mikolov等人做过相关工作，即谷歌的word2vector完成，将原始的1/V模型变化为分布式低维表示)后利用一层卷积层的CNN进行学习。

　　模型结构：

　　首先输入具有两个通道，分别对应static和non-static的方式，其中static方式表明单词向量不会随着训练过程而发生变化，我们可以采用各种各样的固定长度编码，包括one-hot（数据量很小的时候可以用），本文中采用的是google的word2vec的word embedding，将单词转化为维度固定的向量表达。

在卷积层当中，这里与图像识别中的CNN不同的是：这里的卷积核的宽度是一定的（即词向量的维数），而高度代表了词语的个数。例如h=3，即代表了3-gram的上下词信息，h=4，就代表4-gram的信息，h=n表示n-gram。每一个卷积核（Filter）的参数是共享的，代表着一个卷积核只能识别同一类特征。依次顺序往下扫描生成，卷积后生成的feature map不再是一个矩阵，而是一个宽度只有1的列向量（图中的一竖列）。　

　　然后在池化层的pooling采用max pooling，即将每一个Filter卷积得到列向量中的最大值ci取出来，其他的丢弃，因此能得到一个维度为X（X为Filter的数目，例如设置了h=3,4,5三个Filter，X就等于3）。这样做有一个好处，即文中原本只对单词进行了embedding，生成了维度固定的编码，但没有对文本进行这样的操作，因此没一段文本当中包含的单词数也是不同的，如果不进行maxpooling池化的话，会造成维度不一样的情况（实际上也可以对文本进行同维度编码，但是这样做有些复杂，又是一个研究方向了；另外也可以对文本进行padding，即设定一个固定的长度，多了就截掉，少了就补上，我在另外一篇字符级CNN的论文中看到这样的操作，就把长度设置为1014，认为能表达大部分的含义），在进行了maxpooling操作之后，从池化层出来的向量的维度统一变成了X。

　　经过一个池化层之后有一个全连接层，即通常的三层神经网络结构中隐层连接输出层的操作，采用softmax函数输出从属于不同类的分布概率，同时还加了一个dropout操作来防止过拟合，即对全连接层上的权值参数给予L2正则化的限制。

　　还要提到的一点就是前文所说的“两种通道”，实际上第一种通道就是static的，利用word2vec将单词统一编码，而另外一种通道就是non-static，这种方法中所有的单词向量并不是产生后就不发生变化的，而是在训练的过程中会被微调。

　　实际上本文的模型比较简单，但是实际效果非常好。在实验结果中可以看到non-static的方法大多数时候都是要比static方法稍好的，而static方法比rand的方法要好(rand是指word embedding过程中词的编码随机给出)。而结合static和non-static的multichannel方法相较于单纯的static和non-static方法，在较小的数据集上表现比他们都要好（因为这种混合的方法体现了一种折衷的想法，即不希望被微调的单词向量与原始产生的单词向量差距太大，也希望保持一定的动态变化空间）。

卷积神经网络用语句子分类---Convolutional Neural Networks for Sentence Classification 学习笔记的更多相关文章

pytorch -- CNN 文本分类 -- 《 Convolutional Neural Networks for Sentence Classification》
论文 < Convolutional Neural Networks for Sentence Classification>通过CNN实现了文本分类. 论文地址: 666666 模型图 ...
深度学习笔记 (一) 卷积神经网络基础 (Foundation of Convolutional Neural Networks)
一.卷积卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络.使用数层卷积,而不是数层的矩阵相乘.在图像的处理过程中,每一张图片都可以看成一张“ ...
《Convolutional Neural Networks for Sentence Classification》文本分类
文本分类任务中可以利用CNN来提取句子中类似 n-gram 的关键信息. TextCNN的详细过程原理图见下: keras 代码: def convs_block(data, convs=[3, 3, ...
[NLP-CNN] Convolutional Neural Networks for Sentence Classification -2014-EMNLP
1. Overview 本文将CNN用于句子分类任务 (1) 使用静态vector + CNN即可取得很好的效果:=> 这表明预训练的vector是universal的特征提取器,可以被用于多种 ...
树卷积神经网络Tree-CNN: A Deep Convolutional Neural Network for Lifelong Learning
树卷积神经网络Tree-CNN: A Deep Convolutional Neural Network for Lifelong Learning 2018-04-17 08:32:39 看_这是一 ...
斯坦福大学卷积神经网络教程UFLDL Tutorial - Convolutional Neural Network
Convolutional Neural Network Overview A Convolutional Neural Network (CNN) is comprised of one or mo ...
Neural Networks and Deep Learning学习笔记ch1 - 神经网络
近期開始看一些深度学习的资料.想学习一下深度学习的基础知识.找到了一个比較好的tutorial,Neural Networks and Deep Learning,认真看完了之后觉得收获还是非常多的. ...
cs231n spring 2017 lecture1 Introduction to Convolutional Neural Networks for Visual Recognition 听课笔记
1. 生物学家做实验发现脑皮层对简单的结构比如角.边有反应,而通过复杂的神经元传递,这些简单的结构最终帮助生物体有了更复杂的视觉系统.1970年David Marr提出的视觉处理流程遵循这样的原则,拿 ...
[C4W1] Convolutional Neural Networks - Foundations of Convolutional Neural Networks
第一周卷积神经网络(Foundations of Convolutional Neural Networks) 计算机视觉(Computer vision) 计算机视觉是一个飞速发展的一个领域,这多 ...

随机推荐

ubuntu web server ipython notebook install
http://blog.csdn.net/yehuohan/article/details/51389966 ipython notebook installhttp://blog.csdn.net/ ...
Bootstrap历练实例：按钮(Button)插件单个切换
单个切换如需激活单个按钮的切换(即改变按钮的正常状态为按压状态,反之亦然),只需向 button 元素添加 data-toggle="button" 作为其属性即可,如下面实例所 ...
iOS常用第三方类库 Xcode插件
第三方类库(github地址): 1.AFNetworking 网络数据 https://github.com/AFNetworking/AFNetworking 2.SDWebImage 图 ...
Uva 派 (Pie,NWERC 2006,LA 3635)
依然是一道二分查找 #include<iostream> #include<cstdio> #include<cmath> using namespace std; ...
Spring Cloud学习介绍
最近在学spring cloud, 整理了下简单知识要求: 1.要了解springboot 2.了解分布式架构 3.了解微服务 4.了解springcloud是做什么的带着这些,初学者就至少有个 ...
Play on Words HDU - 1116 （并查集 + 欧拉通路）
Play on Words HDU - 1116 Some of the secret doors contain a very interesting word puzzle. The team o ...
DFS:Tempter of the Bone (规定时间达到规定地点)
解题心得: 1.注意审题,此题是在规定的时间达到规定的地点,不能早到也不能晚到.并不是最简单的dfs 2.在规定时间达到规定的地点有几个剪枝: 一.公式:所需的步骤 - x相差行 - y相差列 = 偶 ...
vi a.sh ABCD
E: 无法定位软件包 ubuntu预装的是 vim tiny,安装vim full版本,可以解决卸载vim-tiny: $ sudo apt-get remove vim-common 安装vim ...
android静默安装和智能安装（转）
Android 静默安装和智能安装的实现方法 http://blog.csdn.net/fuchaosz/article/details/51852442 Android静默安装实现方案,仿360手机 ...
Android 显示和隐藏软键盘的方法
前言:因为项目要求做一个类似贴吧一样的东西,可以评论,所以必不可少地需要用到软键盘的隐藏和显示. Step 1 废话不多说,先上封装好的代码. public class CommonUtils ...

卷积神经网络用语句子分类---Convolutional Neural Networks for Sentence Classification 学习笔记

卷积神经网络用语句子分类---Convolutional Neural Networks for Sentence Classification 学习笔记的更多相关文章

随机推荐

热门专题