摘要: 二 倒排索引 倒排索引(英语:Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。有两种不同的反向索引形式:一条记录的水平反向索引(或者反向档案索引)包含每个引用单词的文档的列表。一个单词的水平反向索引(或者完全反向索引)又包含每个单词在一个文档中... 阅读全文
posted @ 2016-04-05 17:44 rocky_24 阅读(331) 评论(0) 推荐(0) 编辑
摘要: 一 数值概要 模式描述: 数值概要模式是计算机数据聚合统计值的一般性模式。 对于合理使用 combiner 以及理解正在做的计算来讲,数值概要模式是极为重要的。 目的 基于某个键将记录分组,并对每个分组计算一系列的聚合值,从而得到较大数据集的高层次视图。 适用场景 要处理的数据是数值数据或者计数 数据可以按照特定的字段... 阅读全文
posted @ 2016-04-05 09:21 rocky_24 阅读(695) 评论(0) 推荐(0) 编辑
希望祖国繁荣,富强! God has given me a gift. Only one. I am the most complete fighter in the world. My whole life, I have trained. I must prove I am worthy of someting. rocky_24