摘要: 目录 传统的自然语言处理模型 NLP的卷积神经网络(textCNN) 卷积层的最大池化问题 testCNN的应用 一句话简介:借鉴视觉的CNN用于自然语言处理中,通过不同高度(词数量)的卷积核提取特征,合并池化压缩至分类,优势是速度提升很多。 一、传统的自然语言处理模型 1)传统的词袋模型或者连续词 阅读全文
posted @ 2020-06-16 23:20 忆凡人生 阅读(680) 评论(0) 推荐(0) 编辑
摘要: 目录 textRNN简介 textRNN网络结构 总结 一句话简介:textRNN指的是利用RNN循环神经网络解决文本分类问题,通常使用LSTM和GRU这种变形的RNN,而且使用双向,两层架构居多。 一、textRNN简介 这里的文本可以一个句子,文档(短文本,若干句子)或篇章(长文本),因此每段文 阅读全文
posted @ 2020-06-16 23:18 忆凡人生 阅读(1927) 评论(0) 推荐(0) 编辑
摘要: 目录 GloVe简介 GloVe解析 公式推导 模型比较 总结 一、GloVe简介 一句话概述:GloVe是一种基于全局语料计数的无监督学习模型,但是采用log(X)作为label,故损失函数采用最小平方损失函数。从全局考虑输出词向量表征。 它来自斯坦福的一篇论文,GloVe全称应该是 Global 阅读全文
posted @ 2020-06-16 22:00 忆凡人生 阅读(968) 评论(0) 推荐(0) 编辑
摘要: 目录 fastText概述 基础知识 LDA主题模型 总结 一句话简述:fastText提出了子词嵌入(subword embedding)的方法。是一种监督学习方法。和word2vec 中的CBOW结构很相似。运行速度较快。 一、fastText概述 1.1 背景 在word2vec中,我们并没有 阅读全文
posted @ 2020-06-16 19:39 忆凡人生 阅读(2581) 评论(0) 推荐(0) 编辑
摘要: 目录 Doc2vec简介 Doc2vec模型 总结 一句话简介:doc2vec(又叫Paragraph Vector)是google的两位大牛Quoc Le和Tomas Mikolov在2014年提出的,是一种非监督式算法,可以获得 sentences/paragraphs/documents 的向 阅读全文
posted @ 2020-06-16 19:37 忆凡人生 阅读(2760) 评论(0) 推荐(1) 编辑
摘要: 目录 LDA概述 基础知识 LDA主题模型 总结 一句话简述:2003年提出的,LDA是一种无监督的词袋式隐含主题模型,LDA给出文档属于每个主题的概率分布,同时给出每个主题上词的概率分布。在文本主题识别、文本分类、文本相似度计算和文章相似推荐等方面都有应用。 一、LDA概述 在机器学习领域,LDA 阅读全文
posted @ 2020-06-16 19:34 忆凡人生 阅读(2278) 评论(0) 推荐(0) 编辑
摘要: 目录 word2vec 简介 CBOW与Skip-Gram模型 优化方法 优点 word2vec API讲解 三个最常见的应用 一句话简述:2013年Google发明,使用跳字节模型(skip-gram)或连续词袋模型(continuous bag of words ,CBOW)训练词向量(初始位o 阅读全文
posted @ 2020-06-16 19:27 忆凡人生 阅读(676) 评论(0) 推荐(0) 编辑