会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
龙渊阁
博客园
首页
新随笔
联系
订阅
管理
2012年11月6日
Porter Stemming Algorithm
摘要: 所谓Stemming,可以称为词根化,这里有个overview。在英语这样的拉丁语系里面,单词有多种变形。比如加上-ed、-ing、-ly等等。在分词的时候,如果能够把这些变形单词的词根找出了,对搜索结果是很有帮助的。Stemming算法有很多了,三大主流算法是Porter stemming algorithm、Lovins stemming algorithm、Lancaster (...
阅读全文
posted @ 2012-11-06 11:51 紫红的泪
阅读(819)
评论(0)
推荐(0)
编辑
公告
点击右上角即可分享