摘要: 方案一(使用ForeachWriter Sink方式): 方案二(ds.writeStream().partitionBy("field")): java代码: 更多方式,请参考《在Spark结构化流readStream、writeStream 输入输出,及过程ETL》 阅读全文
posted @ 2018-10-12 10:53 cctext 阅读(1832) 评论(0) 推荐(0) 编辑
摘要: Dataset的groupBy agg示例 Dataset Join示例: join condition另外一种方式: BroadcastHashJoin示例: 打印结果: SparkSQL Broadcast HashJoin 打印日志 阅读全文
posted @ 2018-10-12 10:04 cctext 阅读(4001) 评论(0) 推荐(1) 编辑