摘要: 阅读全文
posted @ 2022-12-14 16:00 残城碎梦 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 项目起源 Hadoop由ApacheSoftwareFoundation公司于2005年秋天作为Lucene的子项目Nutch的一部分正式引入。它受到最先由GoogleLab开发的 Map/Reduce和 GoogleFileSystem(GFS) 的启发 Google是Hadoop的思想之源(Go 阅读全文
posted @ 2022-12-14 15:47 残城碎梦 阅读(88) 评论(0) 推荐(0) 编辑
摘要: 什么是大数据 大数据(BIGDATA),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程 优化能力的海量、高增长率和多样化的信息资产。 单位换算 1Byte = 8bit 1K=1024KByte 1MB = 1024K 1G 阅读全文
posted @ 2022-12-14 15:31 残城碎梦 阅读(38) 评论(0) 推荐(0) 编辑
摘要: Spark的安装前提: JDK安装 Hadoop安装 Scala安装 前面我们已经写过JDK8和Hadoop3.3.1的安装教程。本文我们就安装Scala(2.11.12),Spark(2.4.7)进行讲解。 Scala安装 官网下载地址:https://downloads.lightbend.co 阅读全文
posted @ 2022-12-14 15:25 残城碎梦 阅读(77) 评论(0) 推荐(0) 编辑