我要去桂林---田春峰的网志

我要去桂林

导航

2005年1月18日 #

小叮咚切分词方法加入sourceforge.net中WebLucene分词模块

摘要: 小叮咚采用的是逆向最大匹配分词法,算法简单,可以满足大部分的分词应用。现在已经集成到WebLucene项目中,开放源代码。有需要的朋友可以下载代码使用。 这个版本还没有实现我在一种面向搜索引擎的中文切分词方法 一文中提到的分词思路。比如: 汉字的StopWords,对标点符号的处理等等。 也希望对分词感兴趣的朋友一起讨论实现改进实现小叮咚分词的切分效果。 ... 阅读全文

posted @ 2005-01-18 21:12 我要去桂林 阅读(571) 评论(0) 推荐(0) 编辑