随笔 - 1162  文章 - 0  评论 - 16  阅读 - 59万 

随笔分类 -  Hadoop

第四章:(2)完全分布式运行模式
摘要:一、分析 (1)准备 3 台客户机(关闭防火墙、静态 IP、主机名称) (2)安装 JDK (3)配置环境变量 (4)安装 Hadoop (5)配置环境变量 (6)配置集群 (7)单点启动 (8)配置 ssh (9)群起并测试集群 二、虚拟机准备 参考第三章的开发环境搭建 三、编写集群分发脚本 xs 阅读全文
posted @ 2022-04-19 23:52 格物致知_Tony 阅读(85) 评论(0) 推荐(0) 编辑
第四章:(1)本地运行模式
摘要:一、Hadoop 运行模式 1、Hadoop 官方网站: http://hadoop.apache.org/ 2、Hadoop 运行模式包括: 本地模式、 伪分布式模式以及完全分布式模式 本地模式:单机运行,只是用来演示一下官方案例。 生产环境不用。 伪分布式模式: 也是单机运行,但是具备 Hado 阅读全文
posted @ 2022-04-19 23:49 格物致知_Tony 阅读(84) 评论(0) 推荐(0) 编辑
第三章:Hadoop 环境搭建
摘要:一、模板虚拟机环境准备 1、创建模板虚拟机 使用 VMWare 安装模板虚拟机, IP 地址 192.168.10.100、 主机名称 hadoop100、内存 4G、硬盘 50G(根据自己笔记本修改) 2、hadoop100 虚拟机配置要求如下(本文 Linux 系统全部以 CentOS-7.5- 阅读全文
posted @ 2022-04-19 23:36 格物致知_Tony 阅读(88) 评论(0) 推荐(0) 编辑
第二章:Hadoop概述
摘要:一、 Hadoop 是什么 1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 2、主要解决, 海量数据的存储和海量数据的分析计算问题。 3、广义上来说, Hadoop通常是指一个更广泛的概念——Hadoop生态圈。 二、Hadoop 发展历史(了解) 1、Hadoop创始人Do 阅读全文
posted @ 2022-04-19 23:30 格物致知_Tony 阅读(143) 评论(0) 推荐(0) 编辑
第一章:大数据概论
摘要:一、大数据概念 大数据( Big Data) : 指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据主要解决, 海量数据的采集、 存储和分析计算问题。 按顺序给出数据存储单位: 阅读全文
posted @ 2022-04-19 22:16 格物致知_Tony 阅读(271) 评论(0) 推荐(0) 编辑
Hadoop【目录】
摘要:【目录】 阅读全文
posted @ 2022-04-19 22:11 格物致知_Tony 阅读(12) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示