Smart_Data

导航

 

2018年2月5日

摘要: Hive本身是建立在Hadoop之上的用于处理结构化数据的数据仓库基础工具。它提供一系列的工具用于数据提取、转化、分析、加载。其提供类SQL语言HQL用于处理存储在Hadoop上的海量数据。所以,数据是在HDFS上,计算是MR/Spark,Hive自身并没有承担过多的压力。Hive不需要做集群。 1 阅读全文
posted @ 2018-02-05 18:38 Smart_Data 阅读(1302) 评论(0) 推荐(0) 编辑