会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
哦呦aholic
博客园
首页
新随笔
联系
订阅
管理
2021年2月18日
实验——散列表(基于词频的文件相似度)详细过程
摘要: 一、 实验目的 1. 掌握散列表相关内容 2. 掌握倒排索引表的应用 二、 实验内容和要求 1. 问题描述 实现一种简单原始的文件相似度计算,即以两文件的公共词汇占总词汇的比例来定义相似度。为简化问题,这里不考虑中文(因为分词太难了),只考虑长度不小于3、且不超过10 的英文单词,长度超过10的只考
阅读全文
posted @ 2021-02-18 21:24 哦呦aholic
阅读(1401)
评论(1)
推荐(0)
编辑
公告