摘要: 原文地址:http://www.parallellabs.com/2013/08/25/impala-big-data-analytics/文/耿益锋陈冠诚大数据处理是云计算中非常重要的问题,自Google公司提出MapReduce分布式处理框架以来,以Hadoop为代表的开源软件受到越来越多公司的... 阅读全文
posted @ 2015-08-31 19:46 一天不进步,就是退步 阅读(572) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://yanbohappy.sinaapp.com/?p=468Hadoop 2.3.0已经发布了,其中最大的亮点就是集中式的缓存管理(HDFS centralized cache management)。这个功能对于提升Hadoop系统和上层应用的执行效率与实时性有很大帮助,本文... 阅读全文
posted @ 2015-08-31 19:38 一天不进步,就是退步 阅读(753) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://yanbohappy.sinaapp.com/?p=110 最新版本的Hadoop代码中已经默认了Protocol buffer(以下简称PB,http://code.google.com/p/protobuf/)作为RPC的默认实现,原来的WritableRpcEng... 阅读全文
posted @ 2015-08-31 19:37 一天不进步,就是退步 阅读(2685) 评论(1) 推荐(1) 编辑
摘要: 原文地址:https://spotify.github.io/snakebite/hadoop_rpc.htmlSnakebite currently implements the following protocol insnakebite.channel.SocketRpcChannelto c... 阅读全文
posted @ 2015-08-31 19:24 一天不进步,就是退步 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 1. hdfs定义HDFS is the primary distributed storage used by Hadoop applications. A HDFS cluster primarily consists of a NameNode that manages the file sy... 阅读全文
posted @ 2015-08-31 16:45 一天不进步,就是退步 阅读(3268) 评论(0) 推荐(0) 编辑