摘要:
目录 GloVe简介 GloVe解析 公式推导 模型比较 总结 一、GloVe简介 一句话概述:GloVe是一种基于全局语料计数的无监督学习模型,但是采用log(X)作为label,故损失函数采用最小平方损失函数。从全局考虑输出词向量表征。 它来自斯坦福的一篇论文,GloVe全称应该是 Global 阅读全文
摘要:
目录 fastText概述 基础知识 LDA主题模型 总结 一句话简述:fastText提出了子词嵌入(subword embedding)的方法。是一种监督学习方法。和word2vec 中的CBOW结构很相似。运行速度较快。 一、fastText概述 1.1 背景 在word2vec中,我们并没有 阅读全文
摘要:
目录 Doc2vec简介 Doc2vec模型 总结 一句话简介:doc2vec(又叫Paragraph Vector)是google的两位大牛Quoc Le和Tomas Mikolov在2014年提出的,是一种非监督式算法,可以获得 sentences/paragraphs/documents 的向 阅读全文
摘要:
目录 LDA概述 基础知识 LDA主题模型 总结 一句话简述:2003年提出的,LDA是一种无监督的词袋式隐含主题模型,LDA给出文档属于每个主题的概率分布,同时给出每个主题上词的概率分布。在文本主题识别、文本分类、文本相似度计算和文章相似推荐等方面都有应用。 一、LDA概述 在机器学习领域,LDA 阅读全文
摘要:
目录 word2vec 简介 CBOW与Skip-Gram模型 优化方法 优点 word2vec API讲解 三个最常见的应用 一句话简述:2013年Google发明,使用跳字节模型(skip-gram)或连续词袋模型(continuous bag of words ,CBOW)训练词向量(初始位o 阅读全文