摘要: 一、介绍 1.sparkStreaming是核心模块Spark API的扩展,具有可伸缩,高吞吐量以及容错的实时数据流处理等。数据可以从许多来源(如Kafka,Flume,Kinesis或TCP套接字)中获取。并且可以使用以高级函数表示的复杂算法进行处理map,例如reduce,join和windo 阅读全文
posted @ 2018-11-06 18:01 stone1234567890 阅读(255) 评论(0) 推荐(0) 编辑