摘要: spark streaming项目 学习笔记 为什么要flume+kafka? 生成数据有高峰与低峰,如果直接高峰数据过来flume+spark/storm,实时处理容易处理不过来,扛不住压力。而选用flume+kafka添加了消息缓冲队列,spark可以去kafka里面取得数据,那么就可以起到缓冲 阅读全文
posted @ 2019-06-01 15:43 消失的白桦林 阅读(320) 评论(0) 推荐(0) 编辑