摘要: HDFS架构是主从模式。 阅读全文
posted @ 2023-06-22 20:56 阿飞藏泪 阅读(7) 评论(0) 推荐(0) 编辑
摘要: Apache Hadoop是一个开源的分布式计算框架,用于处理和存储大规模数据集。它提供了分布式存储和计算能力,可以在集群中运行,并具有高容错性和高扩展性。Hadoop的核心组件包括: Hadoop Distributed File System(HDFS):这是Hadoop的分布式文件系统,用于存 阅读全文
posted @ 2023-06-22 20:49 阿飞藏泪 阅读(65) 评论(0) 推荐(0) 编辑
摘要: Apache是一个非营利性的开源软件基金会,提供了许多流行的开源软件项目,其中包括服务器软件、编程语言等。下面列举了一些Apache基金会管理的知名项目: Apache HTTP Server:最为著名的Web服务器软件,常简称为Apache。Apache Tomcat:用于支持Java的Web应用 阅读全文
posted @ 2023-06-22 20:47 阿飞藏泪 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 什么是大数据 狭义上:大数据是一类技术栈,是一种用来处理海量数据的软件技术体系 广义上:大数据是数字化时代,信息化时代的基础(技术)支撑,以数据为生活赋能。 大数据的核心工作 大数据的核心工作其实就是:从海量的高增长、多类别、低密度的数据中挖掘出高质量的结果。 阅读全文
posted @ 2023-06-22 20:47 阿飞藏泪 阅读(11) 评论(0) 推荐(0) 编辑
1 2 3
4