摘要: code:https://github.com/chantera/bicnn-mi Yin的这篇论文提出了一种叫Bi-CNN-MI的架构,其中Bi-CNN表示两个使用Siamese框架的CNN模型;MI表示多粒度的交互特征。Bi-CNN-MI包含三个部分: 句子分析模型 (CNN-SM) 这部分模型 阅读全文
posted @ 2018-05-26 21:57 乐乐章 阅读(803) 评论(0) 推荐(0) 编辑
摘要: 模型结构与原理 1. 基于CNN的句子建模 这篇论文主要针对的是句子匹配(Sentence Matching)的问题,但是基础问题仍然是句子建模。首先,文中提出了一种基于CNN的句子建模网络,如下图: 图中灰色的部分表示对于长度较短的句子,其后面不足的部分填充的全是0值(Zero Padding)。 阅读全文
posted @ 2018-05-26 17:54 乐乐章 阅读(1875) 评论(0) 推荐(0) 编辑
摘要: Kalchbrenner’s Paper Kal的这篇文章引用次数较高,他提出了一种名为DCNN(Dynamic Convolutional Neural Network)的网络模型,在上一篇(Kim’s Paper)中的实验结果部分也验证了这种模型的有效性。这个模型的精妙之处在于Pooling的方 阅读全文
posted @ 2018-05-26 16:02 乐乐章 阅读(1063) 评论(0) 推荐(0) 编辑
摘要: 文本分类任务中可以利用CNN来提取句子中类似 n-gram 的关键信息。 TextCNN的详细过程原理图见下: keras 代码: 说明如下: 输入层 如图所示,,假设句子有 n 个词,vector的维数为 k ,那么这个矩阵就是 n×k 的。 这个矩阵的类型可以是静态的(static),也可以是动 阅读全文
posted @ 2018-05-26 15:48 乐乐章 阅读(4383) 评论(0) 推荐(0) 编辑