2016年5月28日
摘要: 数据流 MapReduce作业(job)是客户端执行的单位:它包括输入数据、MapReduce程序和配置信息。Hadoop把输入数据划分成等长的小数据发送到MapReduce,称之为输入分片。Hadoop为每个分片创建一个map任务,由它来运行用户自定义的map函数来分析每个分片中的记录。 这里分片 阅读全文
posted @ 2016-05-28 16:14 松伯 阅读(2235) 评论(0) 推荐(0) 编辑
摘要: 客户端API:基础 HBase的主要客户端接口是由org.apache.hadoop.hbase.client包中的HTable类提供的,通过这个类,用户可以完成向HBase存储和检索数据,以及删除无效数据之类的操作。 通常在正常负载下和常规操作下,客户端读操作不会受到其他修改数据的客户端影响,因为 阅读全文
posted @ 2016-05-28 01:44 松伯 阅读(852) 评论(0) 推荐(0) 编辑