2008年6月29日

Clucene实现中文分词搜索(转载)

摘要: 最近,一阵忙乎,终于在Clucene(版本0.9.16)中实现了中文分词搜索。 一些需要改动的地方如下: 一、 把项目设置为Use Unicode Character Set。因为使用ANSI时,汉字存在与其他语言编码重叠的问题,不能准确判断是否为汉字。 二、 \src\CLucene\util\Misc.cpp中有个... 阅读全文

posted @ 2008-06-29 16:32 cy163 阅读(1487) 评论(1) 推荐(0) 编辑

导航