会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
智慧掩盖真相
我的微博
天之道,不争而善胜。
博客园
首页
新随笔
联系
管理
03 2008 档案
话说搜索引擎分词
摘要:按照灰色区域划分,无疑是正确的。但是从全部分词划分上来说,分词的分法达到了 2^n种。 在我见过的分发中,很多种都是大同小异。而很多种都提到了一个概念——最大词匹配。
阅读全文
posted @
2008-03-27 16:52
Birdshover
阅读(6546)
评论(22)
推荐(0)
编辑
SharpICTCLASAnalyzer——基于吕震宇老师翻译的SharpICTCLAS 1.0开发的Lucene.Net 2.1分词接口源码
摘要:以前不是做这个的,一直没在意,今天想想好长时间没上吕震宇老师的博客了,上去看看,看到了这个,呵呵。所以包装了一下。 为了增加Lucene.Net的分词接口,因此修改了部分源码。
阅读全文
posted @
2008-03-26 01:49
Birdshover
阅读(6161)
评论(11)
推荐(0)
编辑
公告