摘要: 上面我们介绍了 Hadoop 本地运行模式的搭建,但是实际生产环境均是采用完全分布式模式的,下面我们采用三个节点来搭建完全分布式的 Hadoop 的环境。 一、准备工作: 准备3台客户机(关闭防火墙、静态ip、主机名称) 安装JDK 配置环境变量 安装Hadoop 配置环境变量 配置集群 单点启动 阅读全文
posted @ 2020-10-09 23:20 晓枫的春天 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 上篇文章对Hadoop 作了简单介绍,下面我们来试着在 虚拟机上安装 Hadoop; 一、虚拟机准备 生产环境 Hadoop 集群在 N 个节点上工作,但是今天学习阶段我准备了 1 台虚拟机进行模拟学习本地模式; 我使用的是:VMware Workstation Pro 软件,将事先准备好的虚拟机克 阅读全文
posted @ 2020-10-09 22:49 晓枫的春天 阅读(268) 评论(0) 推荐(0) 编辑
摘要: 一、什么是大数据? 大数据(Big Data) :在一定时间范围内无法通过常规软件进行捕捉,处理和管理的一系列数据集合,大数据主要解决的是海量数据的存储和分析计算问题。 二、大数据特点 大量 多样 高速 低价值密度 三、Hadoop 是什么? 1、Hadoop 狭义上就是 Apache Hadoop 阅读全文
posted @ 2020-10-09 21:26 晓枫的春天 阅读(208) 评论(0) 推荐(0) 编辑