摘要: Sphinx是一个在GPLv2下分发的全文检索引擎;Coreseek 是一个可供企业使用的、基于Sphinx(可独立于Sphinx原始版本运行)的中文全文检索引擎,按照GPLv2协议发行,商业使用(例如, 嵌入到其他程序中)需要联系我们以获得商业授权。 一般而言,Sphinx是一个独立的全文搜索引擎;而Coreseek是一个支持中文的全文搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度... 阅读全文
posted @ 2010-11-14 18:22 Done 阅读(1694) 评论(0) 推荐(0) 编辑
摘要: sphinx不支持中文分词,国内也有人写了好多个分词组件,本文就讲安装LibMMSeg,它是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。 先从http://www.coreseek.cn/news/7/99/ 上下载到LibMMSeg的安装包,如下:[代码] 然后解压缩:[代码] 进入... 阅读全文
posted @ 2010-11-14 15:07 Done 阅读(2391) 评论(0) 推荐(0) 编辑