2020 年 4月 22 日随笔档案 - HankTown

2020年4月22日

摘要：引言给定两个文本文件（比如2018年政府工作报告.txt与2019年政府工作报告.txt），怎么计算两者的相似度有多大？这是文本挖掘的一个任务，本篇将使用的方法思想如下：使用jieba包分别对两篇中文txt文件进行分词，得如['今天', '我', '遇到', '一只', '蹦蹦跳跳', '的', 阅读全文

posted @ 2020-04-22 23:48 HankTown 阅读(7755) 评论(0) 推荐(1) 编辑

HankTown

公告