摘要: Spark笔记-treeReduce、reduce、reduceByKey 参考资料: http://stackoverflow.com/questions/32281417/understadning-treereduce-in-spark http://stackoverflow.com/que 阅读全文
posted @ 2019-03-14 21:48 天马流欣 阅读(831) 评论(0) 推荐(0) 编辑
摘要: 为了对表进行合理的管理以及提高查询效率,Hive可以将表组织成“分区”。一个分区实际上就是表下的一个目录,一个表可以在多个维度上进行分区,分区之间的关系就是目录树的关系。 1、创建分区表通过PARTITIONED BY子句指定,分区的顺序决定了谁是父目录,谁是子目录。创建有一个分区的分区表:CREA 阅读全文
posted @ 2019-03-14 17:21 天马流欣 阅读(2263) 评论(0) 推荐(0) 编辑