wenter2018

导航

 

Flume

Flume 是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,通过监控整个文件目录或者某一个特定文件,用于收集数据;同时Flume也 提供数据写到各种数据接受方(可定制)的能力,用于转发数据。

 

 

 

Kafka

kafka是分布式发布-订阅消息系统。

它的架构包括以下组件:

话题(Topic):是特定类型的消息流。消息是字节的有效负载(Payload),话题是消息的分类名或种子(Feed)名。

生产者(Producer):是能够发布消息到话题的任何对象。

服务代理(Broker):已发布的消息保存在一组服务器中,它们被称为代理(Broker)或Kafka集群。

消费者(Consumer):可以订阅一个或多个话题,并从Broker拉数据,从而消费这些已发布的消息。

 

 

 

Spark

 

 

 

 

 

 参考:Spark Streaming+Hadoop 实时+离线分析

 

 处理流程

 

 

部署架构

 

 


————————————————

原文链接:https://blog.csdn.net/wyqwilliam/article/details/81916682

https://blog.csdn.net/u011254180/article/details/80172452

posted on 2020-01-02 16:10  wenter2018  阅读(131)  评论(0编辑  收藏  举报