摘要: 阅读全文
posted @ 2018-07-15 15:43 stone1234567890 阅读(377) 评论(0) 推荐(0) 编辑
摘要: Hive 是什么? 1.Hive 是基于 Hadoop处理结构化数据的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类 SQL 查询功能。 2.Hive 利用 HDFS 存储数据,利用MapReduce 查询分析数据。本质是将 SQL 转换为 MapReduce 程序,比直接用 阅读全文
posted @ 2018-07-15 15:42 stone1234567890 阅读(965) 评论(0) 推荐(0) 编辑
摘要: 深入理解hadoop之机架感知 机架感知 hadoop的replication为3,机架感知的策略为: 第一个block副本放在和client所在的datanode里(如果client不在集群范围内,则这第一个node是随机选取的)。第二个副本放置在与第一个节点不同的机架中的datanode中(随机 阅读全文
posted @ 2018-07-15 09:15 stone1234567890 阅读(3252) 评论(1) 推荐(0) 编辑