会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
编程浪子-Yiutto
月落乌啼霜满天,江枫渔火对愁眠
博客园
首页
新随笔
联系
管理
订阅
2015年10月3日
英文分词的算法和原理
摘要: 根据文档相关性计算公式TF-IDF:http://lutaf.com/210.htmBM25:http://lutaf.com/211.htm分词质量对于基于词频的相关性计算是无比重要的英文(西方语言)语言的基本单位就是单词,所以分词特别容易做,只需要3步:根据空格/符号/段落 分隔,得到单词组过滤...
阅读全文
posted @ 2015-10-03 11:16 编程浪子Yiutto
阅读(1173)
评论(0)
推荐(0)
编辑
公告