2020 年 6月 16 日随笔档案 - 忆凡人生

2020年6月16日

摘要：目录传统的自然语言处理模型 NLP的卷积神经网络（textCNN）卷积层的最大池化问题 testCNN的应用一句话简介：借鉴视觉的CNN用于自然语言处理中，通过不同高度（词数量）的卷积核提取特征，合并池化压缩至分类，优势是速度提升很多。一、传统的自然语言处理模型 1）传统的词袋模型或者连续词阅读全文

posted @ 2020-06-16 23:20 忆凡人生阅读(703) 评论(0) 推荐(0) 编辑

【NLP-08】textRNN

摘要：目录 textRNN简介 textRNN网络结构总结一句话简介：textRNN指的是利用RNN循环神经网络解决文本分类问题，通常使用LSTM和GRU这种变形的RNN，而且使用双向，两层架构居多。一、textRNN简介这里的文本可以一个句子，文档(短文本，若干句子)或篇章(长文本)，因此每段文阅读全文

posted @ 2020-06-16 23:18 忆凡人生阅读(1967) 评论(0) 推荐(0) 编辑

【NLP-07】GloVe（Global Vectors for Word Representation）

摘要：目录 GloVe简介 GloVe解析公式推导模型比较总结一、GloVe简介一句话概述：GloVe是一种基于全局语料计数的无监督学习模型，但是采用log(X)作为label，故损失函数采用最小平方损失函数。从全局考虑输出词向量表征。它来自斯坦福的一篇论文，GloVe全称应该是 Global 阅读全文

posted @ 2020-06-16 22:00 忆凡人生阅读(1076) 评论(0) 推荐(0) 编辑

【NLP-06】fastText文本分类算法

摘要：目录 fastText概述基础知识 LDA主题模型总结一句话简述：fastText提出了子词嵌入(subword embedding)的方法。是一种监督学习方法。和word2vec 中的CBOW结构很相似。运行速度较快。一、fastText概述 1.1 背景在word2vec中，我们并没有阅读全文

posted @ 2020-06-16 19:39 忆凡人生阅读(2655) 评论(0) 推荐(0) 编辑

【NLP-05】Doc2vec

摘要：目录 Doc2vec简介 Doc2vec模型总结一句话简介：doc2vec（又叫Paragraph Vector）是google的两位大牛Quoc Le和Tomas Mikolov在2014年提出的，是一种非监督式算法，可以获得 sentences/paragraphs/documents 的向阅读全文

posted @ 2020-06-16 19:37 忆凡人生阅读(2980) 评论(0) 推荐(1) 编辑

【NLP-04】隐含狄利克雷分布(LDA)

摘要：目录 LDA概述基础知识 LDA主题模型总结一句话简述：2003年提出的，LDA是一种无监督的词袋式隐含主题模型，LDA给出文档属于每个主题的概率分布，同时给出每个主题上词的概率分布。在文本主题识别、文本分类、文本相似度计算和文章相似推荐等方面都有应用。一、LDA概述在机器学习领域，LDA 阅读全文

posted @ 2020-06-16 19:34 忆凡人生阅读(2497) 评论(0) 推荐(0) 编辑

【NLP-03】Word2Vec

摘要：目录 word2vec 简介 CBOW与Skip-Gram模型优化方法优点 word2vec API讲解三个最常见的应用一句话简述：2013年Google发明，使用跳字节模型（skip-gram）或连续词袋模型（continuous bag of words ，CBOW）训练词向量（初始位o 阅读全文

posted @ 2020-06-16 19:27 忆凡人生阅读(713) 评论(0) 推荐(0) 编辑

yifanhunter