会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
HankTown
博客园
首页
新随笔
联系
订阅
管理
2020年4月22日
计算2篇文本的文本相似度(python实现)
摘要: 引言 给定两个文本文件(比如2018年政府工作报告.txt与2019年政府工作报告.txt),怎么计算两者的相似度有多大?这是文本挖掘的一个任务,本篇将使用的方法思想如下: 使用jieba包分别对两篇中文txt文件进行分词,得如['今天', '我', '遇到', '一只', '蹦蹦跳跳', '的',
阅读全文
posted @ 2020-04-22 23:48 HankTown
阅读(7755)
评论(0)
推荐(1)
编辑
公告