大数据 - 随笔分类 - runrab

Hbase笔记

摘要：HBase 学习笔记 HBase 介绍 HBase 是一款分布式的、基于列族存储的 NoSQL 数据库，它是基于 Apache Hadoop 项目构建的，使用 HDFS 作为其底层文件存储系统。HBase 能够处理海量数据，支持随机读写，并且能够水平扩展，提供高可靠性和高可用性。 HBase 的数据阅读全文

posted @ 2022-01-12 22:50 runrab 阅读(77) 评论(0) 推荐(0)

Hive笔记

摘要：Hive学习笔记本文介绍了Hive的基本概念、使用方法以及和其他大数据产品的整合。 1. Hive简介 Hive是一个建立在Hadoop上的数据仓库工具，它可以将结构化数据映射为一张数据库表，并提供了类似SQL的查询语言HQL(Hive Query Language)。Hive通过将HQL转换为M 阅读全文

posted @ 2022-01-12 22:49 runrab 阅读(124) 评论(0) 推荐(0)

Kafka笔记

摘要：Kafka笔记简介 Kafka是一个分布式流处理平台，最初由LinkedIn公司开发，现已成为Apache软件基金会的顶级项目。它具有高吞吐量、低延迟和可靠性等特点，适合用于处理大量数据的场景。Kafka主要由三个组件构成：Producer、Broker和Consumer。依赖Zookeeper 阅读全文

posted @ 2022-01-12 22:47 runrab 阅读(51) 评论(0) 推荐(0)

canal笔记

摘要：#canal笔记阅读全文

posted @ 2022-01-12 17:44 runrab 阅读(29) 评论(0) 推荐(0)

Mysql高级

摘要：Mysql高级阅读全文

posted @ 2022-01-12 17:41 runrab 阅读(16) 评论(0) 推荐(0)

Hbase进阶

摘要：核心组成部分 HBase由以下几个核心组成部分组成： HMaster：管理RegionServer的分配、负载均衡、恢复和调度等任务。 RegionServer：维护若干个HRegion，处理客户端的读写请求。 HRegion：存储HBase表中的一部分数据，包括一个或多个HFile和MemStor 阅读全文

posted @ 2022-01-12 17:41 runrab 阅读(69) 评论(0) 推荐(0)

Hive入门

摘要：#Hive入门阅读全文

posted @ 2022-01-12 17:41 runrab 阅读(19) 评论(0) 推荐(0)

ClickHouse入门

摘要：ClickHouse笔记介绍 ClickHouse是一个快速、可扩展、分布式的列式数据库管理系统，旨在处理大规模数据集。它具有快速的数据插入、高性能的查询和支持实时数据更新等特点，非常适用于OLAP场景。ClickHouse已经被广泛应用于各种数据分析场景，如日志分析、BI分析、时序数据分析等。阅读全文

posted @ 2022-01-12 17:40 runrab 阅读(154) 评论(0) 推荐(0)

redis集群搭建

摘要：redis集群搭建阅读全文

posted @ 2022-01-12 14:25 runrab 阅读(25) 评论(0) 推荐(0)

kafka入门

摘要：kafka入门阅读全文

posted @ 2022-01-12 14:24 runrab 阅读(21) 评论(0) 推荐(0)

runrab

enjoy your life

随笔分类 - 大数据

公告