03 2019 档案
摘要:Spark笔记-treeReduce、reduce、reduceByKey 参考资料: http://stackoverflow.com/questions/32281417/understadning-treereduce-in-spark http://stackoverflow.com/que
阅读全文
摘要:为了对表进行合理的管理以及提高查询效率,Hive可以将表组织成“分区”。一个分区实际上就是表下的一个目录,一个表可以在多个维度上进行分区,分区之间的关系就是目录树的关系。 1、创建分区表通过PARTITIONED BY子句指定,分区的顺序决定了谁是父目录,谁是子目录。创建有一个分区的分区表:CREA
阅读全文