SpringStrng

在校大三学生,大数据学习路线学习中 学习并记录总结有关大数据的内容

导航

2022年3月2日 #

Spark学习记录

摘要: SpringStrongGuo Hadoop与Spark Hadoop主要解决,海量数据的存储和海量数据的分析计算。 Spark主要解决海量数据的分析计算。 Spark运行模式 1)Local:运行在一台机器上。 测试用。 2)Standalone:是Spark自身的一个调度系统。 对集群性能要求非 阅读全文

posted @ 2022-03-02 11:25 SpringStrong 阅读(65) 评论(0) 推荐(0) 编辑

2022年2月23日 #

HBase学习记录-API

摘要: delete.addColumns()和delete.addColumn()的区别 /** * delete.addColumns(); * delete.addColumn(); * 区别: * addColumn是删除某一个列簇里的最新时间戳版本。 * 传时间戳,则删除指定版本 * addCol 阅读全文

posted @ 2022-02-23 18:06 SpringStrong 阅读(62) 评论(0) 推荐(0) 编辑

2022年2月22日 #

Kafka学习记录

摘要: Kafka学习记录 定义 Kafka 是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于 大数据实时处理领域。 为什么要用消息队列 1. 解耦 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束。 2. 可恢复性 系统的一部分组件失效时,不会影响到 阅读全文

posted @ 2022-02-22 15:08 SpringStrong 阅读(39) 评论(0) 推荐(0) 编辑

Flume学习记录

摘要: Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传 输的系统。Flume 基于流式架构,灵活简单。 Flume基础架构 Agent Agent 是一个 JVM 进程,它以事件的形式将数据从源头送至目的。 Agent 主要有 3 个部分组成,Source、C 阅读全文

posted @ 2022-02-22 13:56 SpringStrong 阅读(47) 评论(0) 推荐(0) 编辑

HBase学习记录

摘要: HBase学习记录 Day01 2022/2/22 为什么选择HBase HBase逻辑结构 HBase物理结构 HBase架构 HBase详细架构 HBase三层结构 HBase写流程 HBase读流程 为什么选择HBase 1、海量存储 Hbase适合存储PB级别的海量数据,在PB级别的数,能在 阅读全文

posted @ 2022-02-22 13:24 SpringStrong 阅读(133) 评论(0) 推荐(0) 编辑