会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
巴蜀秀才
博客园
首页
新随笔
联系
订阅
管理
2019年11月15日
关键词提取、TF-IDF
摘要: TF-IDF TF-IDF统计的是词库所有词的出现频率与在文件级出现频率的倒数的对数乘积。 TF:即词语出现的频率。 IDF:记每个词出现的文件数为 file_i,总文件数为file_num,IDF[I] = log(file_num/(1+file_i)) TF-IDF = TF * IDF 1
阅读全文
posted @ 2019-11-15 13:25 巴蜀秀才
阅读(441)
评论(0)
推荐(0)
编辑
公告