摘要:
伪分布式模式 启动HDFS并运行MapReduce程序 相关默认配置文件的页面: http://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/core-default.xml 1、修改core-site.xml配置文件 阅读全文
摘要:
Hadoop的运行模式 Hadoop运行模式包括:本地模式、伪分布式模式以及完全分布式模式。 Hadoop官方网站:http://hadoop.apache.org/ 2.7.2版本官网:http://hadoop.apache.org/docs/r2.7.2/ 文档:http://hadoop.a 阅读全文
摘要:
主要流程: 1、克隆虚拟机 2、安装jdk 3、配置静态ip 4、关闭防火墙 参考配置地址: https://blog.csdn.net/qq_38799155/article/details/75949250 然后在opt目录下创建:software、module两个文件 software:用于存 阅读全文
摘要:
Hadoop是什么 1、是一个由apache基金会所开发的分布式系统基础架构 2、主要解决海量数据的存储和海量数据的分析计算 3、广义上说,Hadoop通常是一个广泛的概念 >Hadoop生态圈 发展历史 1、Lucene科=框架是Doug Cutting开创的开源软件,用java代码实现,于goo 阅读全文
摘要:
大数据 大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。 适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库, 云计算平台,互联网,和可扩展的存储系统。 阅读全文