2022 年 2月 22 日随笔档案 - SpringStrong

Kafka学习记录

摘要： Kafka学习记录定义 Kafka 是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。为什么要用消息队列 1. 解耦允许你独立的扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束。 2. 可恢复性系统的一部分组件失效时，不会影响到阅读全文

posted @ 2022-02-22 15:08 SpringStrong 阅读(41) 评论(0) 推荐(0) 编辑

Flume学习记录

摘要： Flume 是 Cloudera 提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构，灵活简单。 Flume基础架构 Agent Agent 是一个 JVM 进程，它以事件的形式将数据从源头送至目的。 Agent 主要有 3 个部分组成，Source、C 阅读全文

posted @ 2022-02-22 13:56 SpringStrong 阅读(48) 评论(0) 推荐(0) 编辑

HBase学习记录

摘要： HBase学习记录 Day01 2022/2/22 为什么选择HBase HBase逻辑结构 HBase物理结构 HBase架构 HBase详细架构 HBase三层结构 HBase写流程 HBase读流程为什么选择HBase 1、海量存储 Hbase适合存储PB级别的海量数据，在PB级别的数，能在阅读全文

posted @ 2022-02-22 13:24 SpringStrong 阅读(139) 评论(0) 推荐(0) 编辑

SpringStrng

导航

公告

Kafka学习记录

Flume学习记录

HBase学习记录