摘要: Hive分区和传统数据库的分区的异同: 分区技术是处理大型数据集经常用到的方法。在Oracle中,分区表中的每个分区是一个独立的segment段对象,有多少个分区,就存在多少个相应的数据库对象。而在Postgresql中分区表其实相当于分别建立了很多小表,其实和Oracle是异曲同工罢了。 在HIV 阅读全文
posted @ 2018-06-12 23:30 空谷幽兰~泊逸 阅读(1752) 评论(0) 推荐(0) 编辑
摘要: Hive中的表分析函数接受零个或多个输入,然后产生多列或多行输出。 1.explode函数 explode函数以array类型数据输入,然后对数组中的数据进行迭代,返回多行结果,一行一个数组元素值 ARRAY函数是将一列输入转换成一个数组输出。 hive (jimdb)> SELECT ARRAY( 阅读全文
posted @ 2018-06-12 23:27 空谷幽兰~泊逸 阅读(5568) 评论(0) 推荐(1) 编辑
摘要: Hive管理表,也叫内部表。Hive控制着管理表的整个生命周期,默认情况下Hive管理表的数据存放在hive的主目录:/user/hive/warehouse/下,并且当我们删除一张表时,这张表的数据也会相应的被删除掉,在文件层面上讲,就是在Hive主目录下的表目录以及目录里面的数据文件都会被删除掉 阅读全文
posted @ 2018-06-12 23:24 空谷幽兰~泊逸 阅读(2113) 评论(0) 推荐(0) 编辑
摘要: 积微,月不胜日,时不胜月,岁不胜时。凡人好敖慢小事,大事至,然后兴之务之。如是,则常不胜夫敦比于小事者矣!何也?小事之至也数,其悬日也博,其为积也大。大事之至也希,其悬日也浅,其为积也小。 故善日者王,善时者霸,补漏者危,大荒者亡!故,王者敬日,霸者敬时,仅存之国危而后戚之。亡国至亡而后知亡,至死而 阅读全文
posted @ 2018-06-10 09:16 空谷幽兰~泊逸 阅读(3281) 评论(0) 推荐(0) 编辑