摘要: 参考:http://www.52nlp.cn/%e7%90%86%e8%ae%ba-%e6%9c%b4%e7%b4%a0%e8%b4%9d%e5%8f%b6%e6%96%af%e6%a8%a1%e5%9e%8b%e7%ae%97%e6%b3%95%e7%a0%94%e7%a9%b6%e4%b8%8e 阅读全文
posted @ 2020-03-12 23:21 小千北同学超爱写代码 阅读(434) 评论(0) 推荐(0) 编辑
摘要: 一、将语料库转化为向量(gensim) 在对语料库进行基本的处理后(分词,去停用词),有时需要将它进行向量化,便于后续的工作。 from gensim import corpora,similarities,models import jieba #第一步:确定语料库的语料和要进行判断的句子: #w 阅读全文
posted @ 2020-03-12 18:40 小千北同学超爱写代码 阅读(875) 评论(0) 推荐(0) 编辑
摘要: 文本向量化就是将文本表示成一系列能够表达文本语义的向量,当前阶段,文本向量化主要是通过词的向量化实现的,word2vec技术就是以词为基本处理单元的。 阅读全文
posted @ 2020-03-12 14:57 小千北同学超爱写代码 阅读(634) 评论(0) 推荐(0) 编辑