摘要: 一、背景 1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。 2、分区表指的是在创建表时指定的partition的分区空间。 3、如果需要创建有分区的表,需要在create表的时候调用可 阅读全文
posted @ 2018-09-14 12:46 静悟生慧 阅读(3351) 评论(0) 推荐(0) 编辑
摘要: 注意在偶数情况下,中位数会存在小数,特别注意! hive里面倒是有个percentile函数和percentile_approx函数,其使用方式为percentile(col, p)、percentile_approx(col, p),p∈(0,1)p∈(0,1) 其中percentile要求输入的 阅读全文
posted @ 2018-09-14 12:16 静悟生慧 阅读(55713) 评论(0) 推荐(0) 编辑
摘要: Docker: 作者:刘允鹏链接:https://www.zhihu.com/question/28300645/answer/67707287来源:知乎 Docker的思想来自于集装箱,集装箱解决了什么问题?在一艘大船上,可以把货物规整的摆放起来。并且各种各样的货物被集装箱标准化了,集装箱和集装箱 阅读全文
posted @ 2018-09-14 10:09 静悟生慧 阅读(208) 评论(0) 推荐(0) 编辑