会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ChouYarn
博客园
首页
新随笔
联系
订阅
管理
2016年12月30日
Spark Streaming消费Kafka Direct方式数据零丢失实现
摘要: 使用场景 Spark Streaming实时消费kafka数据的时候,程序停止或者Kafka节点挂掉会导致数据丢失,Spark Streaming也没有设置CheckPoint(据说比较鸡肋,虽然可以保存Direct方式的offset,但是可能会导致频繁写HDFS占用IO),所以每次出现问题的时候,
阅读全文
posted @ 2016-12-30 10:16 ChouYarn
阅读(4616)
评论(2)
推荐(0)
编辑
公告