摘要: 一些常用于海量数据处理的数据结构,面试较容易问到,随时更新:Hashbit-MAPMap-ReduceTiredTreeBloom Filter外部排序 阅读全文
posted @ 2011-09-14 16:20 Charliee 阅读(147) 评论(0) 推荐(0) 编辑
摘要: 1、Map-Reduce的逻辑过程假设我们需要处理一批有关天气的数据,其格式如下:按照ASCII码存储,每行一条记录每一行字符从0开始计数,第15个到第18个字符为年第25个到第29个字符为温度,其中第25位是符号+/-0067011990999991950051507+0000+0043011990999991950051512+0022+0043011990999991950051518-0011+0043012650999991949032412+0111+0043012650999991949032418+0078+0067011990999991937051507+0001+0043 阅读全文
posted @ 2011-09-14 15:39 Charliee 阅读(236) 评论(0) 推荐(0) 编辑