上一页 1 ··· 4 5 6 7 8

2016年7月26日

摘要: ## Sphinx configuration file sample # 斯芬克斯样例配置文件 # # WARNING! While this sample file mentions all available options, # it contains (very) short helper 阅读全文
posted @ 2016-07-26 00:13 企久Terry 阅读(494) 评论(0) 推荐(0) 编辑

2016年7月25日

摘要: 社工库的规模越来越大,MSSQL的查询速度已经不够用了,改用全文检索,目前效果不错,全库在650G左右,索引160G,全文检索响应时间在5秒以内。 主要参考了The Web Of Answers的一个搭建帖子,具体链接找不到了,做了很多修改和改进,便于添加新库。 给出一些配置信息,有兴趣的同学可以留 阅读全文
posted @ 2016-07-25 02:26 企久Terry 阅读(582) 评论(0) 推荐(0) 编辑
摘要: ## 数据源src1 source src1 { ## 说明数据源的类型。数据源的类型可以是:mysql,pgsql,mssql,xmlpipe,odbc,python ## 有人会奇怪,python是一种语言怎么可以成为数据源呢? ## python作为一种语言,可以操作任意其他的数据来源来获取数 阅读全文
posted @ 2016-07-25 01:00 企久Terry 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 分布式配置很简单,只需要将局域网内的机器连接即可。 vi /usr/local/coreseek/etc/csft.conf 共6台机器的索引及增量,共12项。 然后启动进程 /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csf 阅读全文
posted @ 2016-07-25 00:47 企久Terry 阅读(507) 评论(0) 推荐(0) 编辑
摘要: (1)高速建立索引:建索引速度达到单核10-15mb/s; (2)高速查询:100万记录(约1.2GB数据)下,单核每秒支持约200次搜索; (3)高扩展性:已知最大索引簇支持对30亿条记录建立索引,每天单个连接5千万次搜索; (4)强大附属功能:支持分布式搜索,中文分词引擎,c/java/pyth 阅读全文
posted @ 2016-07-25 00:26 企久Terry 阅读(405) 评论(0) 推荐(0) 编辑
摘要: 不管是网站还是app很多产品的设计思路和产品功能多多少少都有相似之处,那么这边主要讲以下几个场景 描述、话题的搜索 主要的实现思路是全量索引+增量索引方式,可设定时任务定点跑索引 用户昵称的搜索 主要是实现思路是实时索引+分布式索引的方式,用户由于过多,故使用实时索引的方法进行增加,旧数据通过跑脚本 阅读全文
posted @ 2016-07-25 00:18 企久Terry 阅读(262) 评论(0) 推荐(0) 编辑

2016年7月24日

摘要: 有如下可选的匹配模式:SPH_MATCH_ALL, 匹配所有查询词(默认模式);SPH_MATCH_ANY, 匹配查询词中的任意一个;SPH_MATCH_PHRASE, 将整个查询看作一个词组,要求按顺序完整匹配;SPH_MATCH_BOOLEAN, 将查询看作一个布尔表达式SPH_MATCH_EX 阅读全文
posted @ 2016-07-24 23:52 企久Terry 阅读(1383) 评论(0) 推荐(0) 编辑
摘要: 排序模式可使用如下模式对搜索结果排序:SPH_SORT_RELEVANCE 模式, 按相关度降序排列(最好的匹配排在最前面)SPH_SORT_ATTR_DESC 模式, 按属性降序排列 (属性值越大的越是排在前面)SPH_SORT_ATTR_ASC 模式, 按属性升序排列(属性值越小的越是排在前面) 阅读全文
posted @ 2016-07-24 23:49 企久Terry 阅读(724) 评论(0) 推荐(0) 编辑
摘要: //emailid的范围 $sphinx->SetIdRange($min, $max); //属性过滤,可过滤的属性必需在配置文件中设置sql_attr_ ,之前我们定义了这些 sql_attr_uint = fromid sql_attr_uint = toid sql_attr_timesta 阅读全文
posted @ 2016-07-24 23:47 企久Terry 阅读(338) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8

导航