摘要: 1、select语法 SELETC声明可以是union的一部分或者是另一个查询的子查询。 table_reference代表被查询的对象,可以是一个table、view、join结构、或者子查询。 例如:查询表t1的所有列。 SELECT * FROM t1; 1.1 WHERE条件 where条件 阅读全文
posted @ 2017-11-24 01:44 hustzzl 阅读(653) 评论(0) 推荐(0) 编辑
摘要: 1.Hadoop计算框架的特点 数据量大不是问题,数据倾斜是个问题。 jobs数比较多的作业效率相对比较低,比如即使有几百万的表,如果多次关联多次汇总,产生十几个jobs,耗时很长。原因是map reduce作业初始化的时间是比较长的。 sum,count,max,min等UDAF,不怕数据倾斜问题 阅读全文
posted @ 2017-11-24 01:00 hustzzl 阅读(2083) 评论(0) 推荐(0) 编辑