2019年8月27日

Python 结巴分词 + Word2Vec利用维基百科训练词向量

摘要: 结巴分词是一个跨语言的中文分词器,整体效果还算不错,功能也够用,这里直接用Python了,其他主流语言版本均有提供。 Word2Vec,起源于谷歌的一个项目,在我刚开始接触的时候就关注到了他的神奇,大致是通过深度神经网络把词映射到N维空间,处理成向量之后我们终于可以在自然语言处理上方便的使用它进行一 阅读全文

posted @ 2019-08-27 17:14 农夫三拳有點疼 阅读(2118) 评论(0) 推荐(0) 编辑

Python实现RFM模型

该文被密码保护。 阅读全文

posted @ 2019-08-27 13:59 农夫三拳有點疼 阅读(2) 评论(0) 推荐(0) 编辑

NLP—gensim

摘要: 前 言 Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。 它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口。 1 基本概念 阅读全文

posted @ 2019-08-27 13:19 农夫三拳有點疼 阅读(146) 评论(0) 推荐(0) 编辑

导航