|NO.Z.00087|——————————|BigDataEnd|——|Hadoop&kafka.V01|——|kafka.v01|集群与运维|集群应用场景|

一、集群应用场景
### --- 消息传递

~~~     Kafka可以很好地替代传统邮件代理。
~~~     消息代理的使用有多种原因(将处理与数据生产者分离,缓冲未处理的消息等)。
~~~     与大多数邮件系统相比,Kafka具有更好的吞吐量,内置的分区,复制和容错功能,这
~~~     使其成为大规模邮件处理应用程序的理想解决方案。 
~~~     根据我们的经验,消息传递的使用通常吞吐量较低,但是可能需要较低的端到端延迟,
~~~     并且通常取决于Kafka提供的强大的持久性保证。
~~~     在这个领域,Kafka与ActiveMQ或 RabbitMQ等传统消息传递系统相当。
### --- 网站活动路由

~~~     Kafka最初的用例是能够将用户活动跟踪管道重建为一组实时的发布-订阅。
~~~     这意味着将网站活动(页面浏览,搜索或用户可能采取的其他操作)
~~~     发布到中心主题,每种活动类型只有一个主题。这些提要可用于一系列用例的订阅,
~~~     包括实时处理,实时监控,以及加载到Hadoop或脱机数据仓库系统中以进行脱机处理和报告。
~~~     活动跟踪通常量很大,因为每个用户页面视图都会生成许多活动消息。
### --- 监控指标

~~~     Kafka通常用于操作监控数据。这涉及汇总来自分布式应用程序的统计信息,以生成操作数据的集中。
### --- 日志汇总

~~~     许多人使用Kafka代替日志聚合解决方案。
~~~     日志聚合通常从服务器收集物理日志文件,
~~~     并将它们放在中央位置(也许是文件服务器或HDFS)以进行处理。
~~~     Kafka提取文件的详细信息,并以日志流的形式更清晰地抽象日志或事件数据。
~~~     这允许较低延迟的处理,并更容易支持多个数据源和分布式数据消耗。
~~~     与以日志为中心的系统(例如Scribe或Flume)相比,Kafka具有同样出色的性能,
~~~     由于复制而提供的更强的耐用性保证以及更低的端到端延迟。
### --- 流处理

~~~     Kafka的许多用户在由多个阶段组成的处理管道中处理数据,其中原始输入数据从Kafka主题中使用,
~~~     然后进行汇总,充实或以其他方式转换为新主题,以供进一步使用或后续处理。
~~~     例如,用于推荐新闻文章的处理管道可能会从RSS提要中检索文章内容,并将其发布到“文章”主题中。
~~~     进一步的处理可能会使该内容规范化或重复数据删除,并将清洗后的文章内容发布到新主题中;
~~~     最后的处理阶段可能会尝试向用户推荐此内容。这样的处理管道基于各个主题创建实时数据流的图形。
~~~     从0.10.0.0开始,一个轻量但功能强大的流处理库称为Kafka Streams 
~~~     可以在Apache Kafka中使用来执行上述数据处理。
~~~     除了Kafka Streams以外,其他开源流处理工具还包括Apache Storm和 Apache Samza。
### --- 活动采集

~~~     事件源是一种应用程序,其中状态更改以时间顺序记录记录。
~~~     Kafka对大量存储的日志数据的支持使其成为以这种样式构建的应用程序的绝佳后端。
### --- 提交日志

~~~     Kafka可以用作分布式系统的一种外部提交日志。
~~~     该日志有助于在节点之间复制数据,并充当故障节点恢复其数据的重新同步机制。
~~~     Kafka中的日志压缩功能有助于支持此用法。
~~~     在这种用法中,Kafka类似于Apache BookKeeper项目。
~~~     横向扩展,提高Kafka的处理能力
~~~     镜像,副本,提供高可用。

 
 
 
 
 
 
 
 
 

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
                                                                                                                                                   ——W.S.Landor

 

 

posted on   yanqi_vip  阅读(27)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示