会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
首页
联系
Github
博客园
管理
友情链接
暂未分类
我从二院来
苍茫之天涯,乃吾辈之所爱也;浩瀚之程序,亦吾之所爱也,然则何时而爱耶?必曰:先天下之忧而忧,后天下之爱而爱也!
博客园
首页
新随笔
联系
订阅
管理
2023年4月11日
分享一个生产者-消费者的真实场景
摘要: 0.背景 现在有一个大数据平台,我们需要通过spark对hive里的数据读取清洗转换(etl)再加其它的业务操作的过程,然后需要把这批数据落地到tbase数据库(腾讯的一款分布式数据库)。 数据导入的特点是不定时,但量大。每次导入的数据量在几亿到几十亿上百亿之间。 如果使用dataset.write
阅读全文
posted @ 2023-04-11 11:51 是奉壹呀
阅读(357)
评论(0)
推荐(2)
编辑
公告
好文要赞
关注我
收藏该文
←
→
↓
↑