03 2008 档案

摘要:按照灰色区域划分,无疑是正确的。但是从全部分词划分上来说,分词的分法达到了 2^n种。 在我见过的分发中,很多种都是大同小异。而很多种都提到了一个概念——最大词匹配。 阅读全文
posted @ 2008-03-27 16:52 Birdshover 阅读(6546) 评论(22) 推荐(0) 编辑
摘要:以前不是做这个的,一直没在意,今天想想好长时间没上吕震宇老师的博客了,上去看看,看到了这个,呵呵。所以包装了一下。 为了增加Lucene.Net的分词接口,因此修改了部分源码。 阅读全文
posted @ 2008-03-26 01:49 Birdshover 阅读(6161) 评论(11) 推荐(0) 编辑