摘要: Hive分区和传统数据库的分区的异同: 分区技术是处理大型数据集经常用到的方法。在Oracle中,分区表中的每个分区是一个独立的segment段对象,有多少个分区,就存在多少个相应的数据库对象。而在Postgresql中分区表其实相当于分别建立了很多小表,其实和Oracle是异曲同工罢了。 在HIV 阅读全文
posted @ 2018-06-12 23:30 空谷幽兰~泊逸 阅读(1707) 评论(0) 推荐(0) 编辑
摘要: Hive中的表分析函数接受零个或多个输入,然后产生多列或多行输出。 1.explode函数 explode函数以array类型数据输入,然后对数组中的数据进行迭代,返回多行结果,一行一个数组元素值 ARRAY函数是将一列输入转换成一个数组输出。 hive (jimdb)> SELECT ARRAY( 阅读全文
posted @ 2018-06-12 23:27 空谷幽兰~泊逸 阅读(5453) 评论(0) 推荐(1) 编辑
摘要: Hive管理表,也叫内部表。Hive控制着管理表的整个生命周期,默认情况下Hive管理表的数据存放在hive的主目录:/user/hive/warehouse/下,并且当我们删除一张表时,这张表的数据也会相应的被删除掉,在文件层面上讲,就是在Hive主目录下的表目录以及目录里面的数据文件都会被删除掉 阅读全文
posted @ 2018-06-12 23:24 空谷幽兰~泊逸 阅读(2044) 评论(0) 推荐(0) 编辑