Python 结巴分词 + Word2Vec利用维基百科训练词向量
摘要:
结巴分词是一个跨语言的中文分词器,整体效果还算不错,功能也够用,这里直接用Python了,其他主流语言版本均有提供。 Word2Vec,起源于谷歌的一个项目,在我刚开始接触的时候就关注到了他的神奇,大致是通过深度神经网络把词映射到N维空间,处理成向量之后我们终于可以在自然语言处理上方便的使用它进行一 阅读全文
posted @ 2019-08-27 17:14 农夫三拳有點疼 阅读(2118) 评论(0) 推荐(0) 编辑