摘要: 1、Flume 定义 高可用、高可靠、分布式海量日志采集、聚合和传输的系统。流式架构,灵活简单 实时读取服务器本地磁盘的数据,将数据写入到 HDFS 中 Kafka 是一个分布式消息中间件,自带存储,提供 push 和 pull 存取数据功能。它专注于高效地传输大规模数据流, 并提供了高度可扩展的消 阅读全文
posted @ 2023-09-22 11:54 sftsgly 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 1、卡夫卡的定义 (1)传统 卡夫卡是一个分布式的基于发布订阅模式的消息队列,主要应用于大数据实时处理 【发布 / 订阅】 消息的发布者不会将消息直接发送给特定的订阅者,而是将发布的消息分为不同的类别,订阅者只接受感兴趣的消息 (2)最新 卡夫卡是一个开源的分布式事件流平台,被千家公司用于高性能数据 阅读全文
posted @ 2023-09-22 01:20 sftsgly 阅读(144) 评论(0) 推荐(0) 编辑