TextCNN

第一个模型就是TextCNN
对于textcnn一个基本介绍可以参考这里
textcnn 模型的pytorch实现版本

需要参考的链接
文本分类模型pytorch实现-1
文本分类模型pytorch实现-2
文本分类模型多通道CNN讲解
 文本分类模型深度CNN讲解
 NLP如何入门不要看书，不要系统的学习，需要补那些线代的知识

CNN模型用在文本分类的方面，论文参考的是这里
详细过程原理图如下:

我对这个流程进行一个简单的梳理:

首先第一点，我们要弄清楚为什么CNN可以被用在文本分类（或者从更大的方面讲为什么可以用在自然语言处理NLP方面）

对于这一点，网络上有很多解释，我这里从最只用的角度去分析这个问题。

CNN可以被用于图像，是因为图像是一个二维物体(这里假设是灰度图，是二维情况，如果是彩色图当然是三维情况)。这样CNN卷积操作才可以被使用。
所以如果自然语言处理方面的任务想要使用CNN，一个核心操作就是要将文本想图像的方向类比-将文本转化为一个二维图像类似体(针对单通道情况)。
我们知道，文本处理过程中，我们需要将一个句子中每个单词转化为词向量。那么一个句子就相当于含有n个单词，每个单词含有d维词向量。那么一个句子就可以很简单的被当做一个n*d的二维图像。这样CNN就可以处理文本。

了解了上面这一点，TextCNN原理图中的第一步就可以清晰了解了。也就是图中最左边的7*5的句子矩阵。7代表的是句子长度，5代表的是单词词向量维度(当然这里只是简化了，一般词向量维度要远大于5，常用为200，300)。我们可以把这个句子矩阵中每个点类比为图像中的原始像素点。

接下来，我们的操作就是进行卷积。卷积一个基本的概念就是卷积核。对于卷积核，我们需要掌握两个部分，一个是卷积核的大小，一个是卷积核的数量。在论文中，设定的卷积核的大小是三种，分别是2,3,4（注意这里的2,3,4代表的是卷积核的高度(也就是竖着的方向)，对于卷积核的宽度(也就是横着的方向)我们要设定它与词向量的维度是一样的）。对于每一个大小的卷积核，我们设定它的数量是2（一般在实际操作中，会远远大于2，常用200）。我们知道与卷积核对应的是卷积之后的通道数。所以这里每种大小的卷积核对应两个通道的输出。明白了这一点，也就明白了上图中第二列和第三列的内容。第三列对应的就是卷积之后的结果。

接下来，我们进行的就是最大池化操作，这里使用的是1-max pooling。经过这个操作之后，每个通道得到的就是一个像素点，将所有的这些点拼接起来。

全连接层和softmax层

流程就这样搞明白了，接下来，我们抓一下细节问题。

首先对于词向量，有静态(static)和非静态(non-static)两种。静态方式就是说明在训练过程中我们是不更新词向量的，我们使用的是一些已经训练好的词向量，比如说word2vec预训练的词向量。这种情况对于数据量比较小的情况效果比较不错。另一种非静态的方式是在训练过程中更新词向量(这个词向量可以是我们在pytorch 中embedding层去初始化词向量，还可以是使用预训练的词向量)。我们一般推荐的是使用预训练的词向量例如word2vec，然后在训练过程中进行更新。当然如果我们具有足够的资源和数据，使用embedding随机初始化词向量，在训练过程中更新也是可以的。

对于CNN中的通道，我们知道在图像中，我们是有着RGB三种通道的。一般来说文本文字矩阵是可以看做一个二维图像，如果想要使用通道数，我们一般是把同一个句子使用不同的embedding方式（比如说一个使用word2vec一个使用Glove或者一个使用静态词向量和fine-tunning词向量作为不同channel的做法）

posted @ 2019-03-15 11:30 DUDUDA 阅读(923) 评论(0) 编辑收藏举报

刷新页面返回顶部

DUDUDA

TextCNN

公告