上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 50 下一页

2019年12月3日

神经序列模型之RNN 及其变种LSTM、GRU

摘要: 序列数据的处理,从语言模型 N-gram 模型说起,然后着重谈谈 RNN,并通过 RNN 的变种 LSTM 和 GRU 来实战文本分类。 语言模型 N-gram 模型 一般自然语言处理的传统方法是将句子处理为一个词袋模型(Bag-of-Words,BoW),而不考虑每个词的顺序,比如用朴素贝叶斯算法 阅读全文

posted @ 2019-12-03 15:52 农夫三拳有點疼 阅读(2103) 评论(0) 推荐(0) 编辑

NLP中的HMM 和 CRF

摘要: 在自然语言处理领域中,HMM(隐马尔可夫模型)和 CRF(条件随机场)算法常常被用于分词、句法分析、命名实体识别、词性标注等。由于两者之间有很大的共同点,所以在很多应用上往往是重叠的,但在命名实体、句法分析等领域 CRF 似乎更胜一筹。通常来说如果做自然语言处理,这两个模型应该都要了解,下面我们来看 阅读全文

posted @ 2019-12-03 15:50 农夫三拳有點疼 阅读(1891) 评论(0) 推荐(0) 编辑

中文短文本聚类

摘要: 文本聚类是将一个个文档由原有的自然语言文字信息转化成数学信息,以高维空间点的形式展现出来,通过计算哪些点距离比较近,从而将那些点聚成一个簇,簇的中心叫做簇心。一个好的聚类要保证簇内点的距离尽量的近,但簇与簇之间的点要尽量的远。 如下图,以 K、M、N 三个点分别为聚类的簇心,将结果聚为三类,使得簇内 阅读全文

posted @ 2019-12-03 15:48 农夫三拳有點疼 阅读(4477) 评论(1) 推荐(2) 编辑

中文短文本分类

摘要: 文本分类,属于有监督学习中的一部分,在很多场景下都有应用,下面通过小数据的实例,一步步完成中文短文本的分类实现,整个过程尽量做到少理论重实战。 下面使用的数据是一份司法数据,需求是对每一条输入数据,判断事情的主体是谁,比如报警人被老公打,报警人被老婆打,报警人被儿子打,报警人被女儿打等来进行文本有监 阅读全文

posted @ 2019-12-03 15:47 农夫三拳有點疼 阅读(2265) 评论(1) 推荐(0) 编辑

词袋和词向量模型

摘要: 词袋模型(Bag of Words Model) 词袋模型的概念 先来看张图,从视觉上感受一下词袋模型的样子。 词袋模型看起来像一个口袋把所有词都装进去,但却不完全如此。在自然语言处理和信息检索中作为一种简单假设,词袋模型把文本(段落或者文档)被看作是无序的词汇集合,忽略语法甚至是单词的顺序,把每一 阅读全文

posted @ 2019-12-03 15:44 农夫三拳有點疼 阅读(1614) 评论(0) 推荐(0) 编辑

上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 50 下一页

导航