2022 年 10月 16 日随笔档案 - 消失的白桦林

2022年10月16日

摘要： spark通过pipline方式批量插入redis集群网上资料比较少，但是有一大堆都是单机的方式，spring倒是也有写入redis集群的实现代码，以下整理了spark通过pipline批量写入的方式，速度确实快，不然一条条set进去，真的是天都要黑了。依赖到的maven有以下（spark忽略）：阅读全文

posted @ 2022-10-16 20:52 消失的白桦林阅读(542) 评论(0) 推荐(0) 编辑

spark更新插入(upsert)到mysql方式

摘要： spark数据有时候需要插入mysql中的数据，有时候存在的更新已经存在的数据，也就是mpp中的upsert操作，但是spark暂时给的api只有overwrite, append等，无法满足插入更新业务逻辑；因此需要自定义实现，可以自行批量方式处理，例如： insert into personi 阅读全文

posted @ 2022-10-16 20:31 消失的白桦林阅读(1382) 评论(0) 推荐(0) 编辑

似水流年

公告