会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
郑先森Z_z
博客园
首页
新随笔
联系
订阅
管理
2020年4月12日
周总结
摘要: '''TFIDF原理 TF:单词词频。一个词在文章中出现的频率,公式:tf=词在文章中出现的次数/文章总的词汇数。文章可以是一个句子,也可以是一篇文章,根据具体情况定。 idf:逆文件频率。词在该文章中出现的次数越少,越能够代表该文章。 IDF=log(语料库的总文档数/包含该词条的文档数+1),分
阅读全文
posted @ 2020-04-12 07:38 HHHarden13
阅读(80)
评论(0)
推荐(0)
编辑
公告