上一页 1 2 3 4 5 6 7 8 9 ··· 37 下一页
摘要: [TOC] ## 一、概述 `Hadoop` 是一个开源的分布式计算框架,用于处理大规模数据集的存储和处理。它使用了 `Hadoop` 分布式文件系统`(Hadoop Distributed File System,HDFS)`来存储数据,并通过 `MapReduce` 编程模型进行数据处理。 ![ 阅读全文
posted @ 2023-07-09 18:17 大数据老司机 阅读(1970) 评论(0) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 `MinIO` 是一个开源的**对象存储服务器**,它兼容`Amazon S3(Simple Storage Service)API`。它被设计用于构建分布式存储架构,提供高可用性、高性能和可扩展的对象存储解决方案。 下面是MinIO的一些主要特点和功能: - **对象存 阅读全文
posted @ 2023-06-25 22:01 大数据老司机 阅读(1972) 评论(0) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 > ClickHouse是一种**高性能、列式存储的分布式数据库管理系统**。它专注于快速数据分析和查询,并且在大规模数据集上表现出色。 在ClickHouse中,数据按列存储而不是按行存储。这种存储方式有许多优点,特别适合分析工作负载。下面是一些与列数据存储相关的关键概 阅读全文
posted @ 2023-06-24 18:33 大数据老司机 阅读(2250) 评论(0) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 `Apache DolphinScheduler`(简称DolphinScheduler)是一种开源的、分布式的、易于使用的大数据工作流调度系统。它旨在为大数据处理提供一个可靠、高效和可扩展的调度解决方案。 ![在这里插入图片描述](https://img-blog.cs 阅读全文
posted @ 2023-06-20 22:55 大数据老司机 阅读(3260) 评论(0) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 `Apache DolphinScheduler`(简称`DolphinScheduler`)是一种开源的、分布式的、易于使用的大数据工作流调度系统。它旨在为大数据处理提供一个可靠、高效和可扩展的调度解决方案。 DolphinScheduler具有以下特点和功能: - * 阅读全文
posted @ 2023-06-19 23:44 大数据老司机 阅读(1461) 评论(0) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 `Apache Ambari` **是 Hortonworks 贡献给Apache开源社区的顶级项目,它是一个基于web的工具,用于安装、配置、管理和监视 Hadoop 集群。** Ambari 目前已支持大多数 Hadoop 组件,包括 HDFS、MapReduce、H 阅读全文
posted @ 2023-06-18 19:26 大数据老司机 阅读(970) 评论(0) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 `Apache Ambari` **是 Hortonworks 贡献给Apache开源社区的顶级项目,它是一个基于web的工具,用于安装、配置、管理和监视 Hadoop 集群。** Ambari 目前已支持大多数 Hadoop 组件,包括 HDFS、MapReduce、H 阅读全文
posted @ 2023-06-13 22:48 大数据老司机 阅读(4331) 评论(0) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 StarRocks是一个开源的分布式OLAP(在线分析处理)数据库,旨在提供高性能、低延迟的数据分析和查询能力。它最初由中国的猎豹移动公司(Cheetah Mobile)开发,并于2016年开源。 StarRocks主要特点和功能包括: - **列式存储**:StarRo 阅读全文
posted @ 2023-06-12 22:00 大数据老司机 阅读(1261) 评论(1) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 `Apache Azkaban` 是一个开源的批处理**工作流调度系统**,用于管理和调度Hadoop生态系统中的任务和作业。 - `Azkaban` 提供了一个直观的Web界面,让用户能够轻松地定义、调度和监控作业流。它支持工作流的可视化编辑,可以将任务以依赖关系的方式 阅读全文
posted @ 2023-06-11 18:20 大数据老司机 阅读(437) 评论(0) 推荐(0) 编辑
摘要: [TOC] ## 一、概述 `HBase` 是一个开源的 `NoSQL` **列式分布式数据库**,它主要基于 `Hadoop` 分布式文件系统(HDFS)运行。`HBase` 最初是由 `Facebook` 公司贡献,其基于 `Google`的 `Bigtable` 模型开发,在强大的水平扩展性和 阅读全文
posted @ 2023-06-04 16:20 大数据老司机 阅读(971) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 37 下一页