摘要:
spark通过pipline方式批量插入redis集群网上资料比较少,但是有一大堆都是单机的方式,spring倒是也有写入redis集群的实现代码,以下整理了spark通过pipline批量写入的方式,速度确实快,不然一条条set进去,真的是天都要黑了。 依赖到的maven有以下(spark忽略): 阅读全文
摘要:
spark数据有时候需要插入mysql中的数据,有时候存在的更新已经存在的数据,也就是mpp中的upsert操作,但是spark暂时给的api只有overwrite, append等,无法满足插入更新业务逻辑; 因此需要自定义实现,可以自行批量方式处理,例如: insert into personi 阅读全文