摘要: 引言 给定两个文本文件(比如2018年政府工作报告.txt与2019年政府工作报告.txt),怎么计算两者的相似度有多大?这是文本挖掘的一个任务,本篇将使用的方法思想如下: 使用jieba包分别对两篇中文txt文件进行分词,得如['今天', '我', '遇到', '一只', '蹦蹦跳跳', '的', 阅读全文
posted @ 2020-04-22 23:48 HankTown 阅读(7697) 评论(0) 推荐(1) 编辑