摘要: 引言 join是SQL中的常用操作,良好的表结构能够将数据分散到不同的表中,使其符合某种规范(mysql三大范式),可以最大程度的减少数据冗余,更新容错等,而建立表和表之间关系的最佳方式就是join操作。 对于Spark来说有3种Join的实现,每种Join对应的不同的应用场景(SparkSQL自动 阅读全文
posted @ 2018-11-05 20:17 多读书多看报 阅读(14141) 评论(2) 推荐(1) 编辑