2021年9月26日

大数据学习(29)—— Spark Streaming

摘要: Spark提供了DataFrame和DataSet API来处理批量数据,它们把数据转换成RDD,在内存中以迭代器的方式不落盘处理,所以效率很高。但它有一个弊端,就是不能准实时计算数据变化。 为了解决上述问题,Spark引入了Spark Stream来处理准流式数据。为啥说准流式呢?因为它本质上还是 阅读全文

posted @ 2021-09-26 12:29 别样风景天 阅读(213) 评论(0) 推荐(0) 编辑

导航