2012年12月20日

摘要: 1. 简单介绍 Xapian 是一个开源的搜索引擎库,是用C++来编写的,准许GPL协议(http://www.opensource.org/licenses/gpl-license.php),它现在可以与Perl,python,PHP,Java等语言来绑定使用。 和Lucene一样,Xapian只是一个搜索引擎工具库,用户可以在其上自己扩展其适合的应用,它是基于概率模型来做为查询分数计算的基本,当然,它还提供了丰富的Boolean查询功能。 如果你想把Xapian使用在你的网站上,你可以使用Xapian的一个套装,Omega可以满足你的大部分需求,当然它的扩展性还是不错的。 目前Xpian的 阅读全文

posted @ 2012-12-20 11:40 hiBOSS 阅读(606) 评论(0) 推荐(0) 编辑

摘要: Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。Sphinx 单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。Sphinx的 阅读全文

posted @ 2012-12-20 11:38 hiBOSS 阅读(194) 评论(0) 推荐(0) 编辑