2021年4月6日

textRNN & textCNN

摘要: 1. 什么是textRNN textRNN指的是利用RNN循环神经网络解决文本分类问题,文本分类是自然语言处理的一个基本任务,试图推断出给定文本(句子、文档等)的标签或标签集合。 文本分类的应用非常广泛,如: 垃圾邮件分类:2分类问题,判断邮件是否为垃圾邮件 情感分析:2分类问题:判断文本情感是积极 阅读全文

posted @ 2021-04-06 15:02 农夫三拳有點疼 阅读(179) 评论(0) 推荐(0) 编辑

全局向量词嵌入(GloVe)

摘要: 1. 说说GloVe 正如GloVe论文的标题而言,**GloVe的全称叫Global Vectors for Word Representation,它是一个基于全局词频统计(count-based & overall statistics)的词表征(word representation)工具, 阅读全文

posted @ 2021-04-06 14:59 农夫三拳有點疼 阅读(379) 评论(0) 推荐(0) 编辑

子词嵌入(fastText)

摘要: 1. 什么是fastText 英语单词通常有其内部结构和形成⽅式。例如,我们可以从“dog”“dogs”和“dogcatcher”的字⾯上推测它们的关系。这些词都有同⼀个词根“dog”,但使⽤不同的后缀来改变词的含义。而且,这个关联可以推⼴⾄其他词汇。 在word2vec中,我们并没有直接利⽤构词学 阅读全文

posted @ 2021-04-06 14:23 农夫三拳有點疼 阅读(123) 评论(0) 推荐(0) 编辑

词嵌入(Word2Vec)

摘要: 1. 什么是词嵌入(Word Embedding) ⾃然语⾔是⼀套⽤来表达含义的复杂系统。在这套系统中,词是表义的基本单元。顾名思义,词向量是⽤来表⽰词的向量,也可被认为是词的特征向量或表征。把词映射为实数域向量的技术也叫词嵌⼊(word embedding)。近年来,词嵌⼊已逐渐成为⾃然语⾔处理的 阅读全文

posted @ 2021-04-06 11:22 农夫三拳有點疼 阅读(703) 评论(0) 推荐(0) 编辑

导航