上一页 1 ··· 254 255 256 257 258 259 260 261 262 ··· 273 下一页
摘要: 4.10 同义词文件/Synonym 同义词文件格式 from=>to AT &T => AT&T AT & T => AT & T standarten fuehrer => Standartenfuehrer standarten fuhrer => Standartenfuehrer Ms-D 阅读全文
posted @ 2017-01-05 09:08 bonelee 阅读(352) 评论(0) 推荐(0)
摘要: 1 概述 这是基于开源的sphinx全文检索引擎的架构代码分析,本篇主要描述index索引服务的分析。当前分析的版本 sphinx-2.0.4 1 概述 这是基于开源的sphinx全文检索引擎的架构代码分析,本篇主要描述index索引服务的分析。当前分析的版本 sphinx-2.0.4 这是基于开源 阅读全文
posted @ 2017-01-05 09:07 bonelee 阅读(806) 评论(0) 推荐(0)
摘要: 摘自:http://blog.csdn.net/yang_yulei/article/details/46337405 哈希树的理论基础 【质数分辨定理】 简单地说就是:n个不同的质数可以“分辨”的连续整数的个数和他们的乘积相等。“分辨”就是指这些连续的整数不可能有完全相同的余数序列。 (这个定理的 阅读全文
posted @ 2017-01-04 17:44 bonelee 阅读(1422) 评论(0) 推荐(0)
摘要: 摘自:http://blog.csdn.net/cangyingzhijia/article/details/8592441 Sphinx使用的文件包括 “sph”, “spa”, “spi”, “spd”, “spp”, “spm” ,还有锁文件。其中sph是系统的配置文件。其它则为索引文件。 . 阅读全文
posted @ 2017-01-04 17:18 bonelee 阅读(1931) 评论(1) 推荐(0)
摘要: 转自:http://github.tiankonguse.com/blog/2014/12/03/sphinx-token-inverted-sort.html 外部排序 现在我们的背景是有16个已经排序的数据存在磁盘上。由于数据量很大,我们不能一次性全部读进来。 我们的目标是依次挑出最小的hit, 阅读全文
posted @ 2017-01-04 17:09 bonelee 阅读(595) 评论(0) 推荐(0)
摘要: 转自:http://github.tiankonguse.com/blog/2014/12/03/sphinx-token-inverted-sort.html 前言 sphinx 在创建索引前需要做下面几件事:有数据源(pSource),有分词器(pTokenizer),有停止词Stopword 阅读全文
posted @ 2017-01-04 16:58 bonelee 阅读(479) 评论(0) 推荐(0)
摘要: 摘自:http://blog.jobbole.com/101672/ What/Sphinx是什么 定义:Sphinx是一个全文检索引擎。 特性: 索引和性能优异 易于集成SQL和XML数据源,并可使用SphinxAPI、SphinxQL或者SphinxSE搜索接口 易于通过分布式搜索进行扩展 高速 阅读全文
posted @ 2017-01-04 16:07 bonelee 阅读(1755) 评论(0) 推荐(0)
摘要: 大数据处理的关键架构层: 大数据处理的关键架构层 摘自:http://weibo.com/ttarticle/p/show?id=2309403960679466973487 阅读全文
posted @ 2017-01-04 15:44 bonelee 阅读(453) 评论(0) 推荐(0)
摘要: 什么是OLAP(联机分析处理)? 这个是和数据处理非常相关的一个概念。接触过BI(商务智能)的同学一定清楚。 数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processi 阅读全文
posted @ 2017-01-04 15:33 bonelee 阅读(1416) 评论(0) 推荐(0)
摘要: Druid底层不保存原始数据,而是借鉴了Apache Lucene、Apache Solr以及ElasticSearch等检索引擎的基本做法,对数据按列建立索引,最终转化为Segment,用于存储、查询与分析。 首先,无论是实时数据还是批量数据在进入Druid前都需要经过Indexing Servi 阅读全文
posted @ 2017-01-04 15:23 bonelee 阅读(3393) 评论(0) 推荐(0)
上一页 1 ··· 254 255 256 257 258 259 260 261 262 ··· 273 下一页