coreseek及sphinx很多词搜索不到的原因
问题:使用coreseek搜索关键词发现搜索出来数据还没有mysql模糊查询的数据多。。。问题出在配置的参数上。
代码如下:
<?php require_once('sphinxapi.php'); $key = isset($_GET['keys'])?$_GET['keys']:'一个'; $page = isset($_GET['page'])?$_GET['page']:1; $limit = $page * 10; $sphinx = new SphinxClient(); $sphinx->SetServer("127.0.0.1",XXXX); $sphinx->SetMatchMode(SPH_MATCH_ALL); $sphinx->SetLimits($limit, 10, 1000); $sphinx->SetArrayResult(true); $result = $sphinx -> query($key,"search_notes"); echo json_encode($result);
关键点在于这里(如下),设置匹配模式。默认选项是SPH_MATCH_ALL:
$sphinx->SetMatchMode(SPH_MATCH_ALL);
匹配模式可供选择的参数及详解:
SPH_MATCH_ALL, 匹配所有查询词(默认模式);
比如:关键词为“钱包身份证”,可以搜索到标题“我的钱包里有身份证”,但是搜索不到标题“我有钱包”;必须满足匹配所有的分词。
SPH_MATCH_ANY, 匹配查询词中的任意一个;
比如:关键词为“钱包身份证”,可以搜索到标题“我的钱包里有身份证”,也可以搜索到标题“我有钱包”;满足匹配所有的分词中的一个即可。
SPH_MATCH_PHRASE, 将整个查询看作一个词组,要求按顺序完整匹配;
比如:关键词为“钱包身份证”,可以搜索到标题“我有钱包身份”,搜索不到标题“我的钱包里有身份证;将关键词作为整体去搜索,类似于Mysql中的like模糊查询。
SPH_MATCH_BOOLEAN, 将查询看作一个布尔表达式 ;
SPH_MATCH_EXTENDED, 将查询看作一个Sphinx/Coreseek内部查询语言的表达式。