上一页 1 ··· 224 225 226 227 228 229 230 231 232 ··· 273 下一页
摘要: 我的配置就是酱紫! 其中,还需要做的工作有以下几个: 安装nerdtree插件,两种方式,推荐第二种(1) http://www.vim.org/scripts/script.php?script_id=1658 下载zip,然后解压到.vim目录下。 (2)或者是通过vim插件管理工具apt-vi 阅读全文
posted @ 2017-04-06 16:47 bonelee 阅读(1539) 评论(3) 推荐(0)
摘要: Why DocValues? The standard way that Solr builds the index is with an inverted index. This style builds a list of terms found in all the documents in 阅读全文
posted @ 2017-04-05 17:27 bonelee 阅读(1763) 评论(4) 推荐(0)
摘要: Lucene 5.4 DocValues format. Encodes the five per-document value types (Numeric,Binary,Sorted,SortedSet,SortedNumeric) with these strategies: NUMERIC: 阅读全文
posted @ 2017-04-05 16:42 bonelee 阅读(1354) 评论(2) 推荐(0)
摘要: 什么是docValues? docValues是一种记录doc字段值的一种形式,在例如在结果排序和统计Facet查询时,需要通过docid取字段值的场景下是非常高效的。 为什么要使用docValues? 这种形式比老版本中利用fieldCache来实现正排查找更加高效,更加节省内存。倒排索引将字段内 阅读全文
posted @ 2017-04-05 16:26 bonelee 阅读(2868) 评论(1) 推荐(1)
摘要: 前言: 在Lucene4.x之后,出现一个重大的特性,就是索引支持DocValues,这对于广大的solr和elasticsearch用户,无疑来说是一个福音,这玩意的出现通过牺牲一定的磁盘空间带来的好处主要有两个: (1)节省内存 (2)对排序,分组和一些聚合操作时能够大大提升性能 下面来详细介绍 阅读全文
posted @ 2017-04-05 16:20 bonelee 阅读(3992) 评论(0) 推荐(1)
摘要: Hi,I have index ~31G where27% of the index size is .fdt files (8.5G)20% - .fdx files (6.2G)37% - .frq files (11.6G)16% - .tim files (5G) This is the t 阅读全文
posted @ 2017-04-05 15:59 bonelee 阅读(624) 评论(0) 推荐(0)
摘要: A Lucene index segment can be viewed as a "mini" index or a shard. Each segment is a collection of all needed files for an index, including .tim and . 阅读全文
posted @ 2017-04-05 15:01 bonelee 阅读(843) 评论(0) 推荐(0)
摘要: http://www.cnblogs.com/bonelee/p/6667955.html shinx索引部分源码分析——过程:连接到CSphSource对应的sql数据源,通过fetch row取其中一行,然后解析出field,分词,获得wordhit,最后再加入到CSphSource的Hits里 阅读全文
posted @ 2017-04-05 12:13 bonelee 阅读(1007) 评论(0) 推荐(0)
摘要: 后面就是初始化一些存储结构,其中重点说下缓存出来的几个临时文件分别的作用。结尾时tmp0的存储的是被上锁的Index,有些Index正在被查询使用 故上锁。tmp1,即对应将来生成的spp文件,存储词汇的位置信息,包含该词所在的文档ID,该词所在词典对应的ID,以及该词在本文档中的位置信息。 tmp 阅读全文
posted @ 2017-04-05 11:41 bonelee 阅读(520) 评论(0) 推荐(0)
摘要: CSphSource 数据源 CSphSource_XMLPipe2-XML文件获取数据 CSphSource_SQL-SQL(MySQL)获取数据 CSphIndex 索引器 派生类CSphIndex_VLN // 索引过程 virtual int Build ( CSphDict * pDict 阅读全文
posted @ 2017-04-05 11:30 bonelee 阅读(685) 评论(0) 推荐(0)
上一页 1 ··· 224 225 226 227 228 229 230 231 232 ··· 273 下一页