随笔分类 - hadoop
摘要:hdfs所有命令行均有$HADOOP_HOME/bin/hadoop脚本执行,不指定参数bin/hadoop会显示所有命令的描述,可通过hadoop fs -help查看命令帮助。 hdfs命令执行样式为hadoop fs -shell 一、文件上传与下载 1、文件上传,将文件从linux本地上传至
阅读全文
摘要:一、hdfs概述 HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的简称,它的设计目标是把超大数据集存储到网络中的多台普通计算机上,并提供高可靠性和高吞吐率的服务。 HDFS的优点:高容错性:数据自动保存多个副本,hdfs默认的副本数量是3适合处理
阅读全文
摘要:基础环境centos7.5,jdk-8u212-linux-x64、hadoop-3.1.3.tar.gz。 Hadoop 下载地址:https://archive.apache.org/dist/hadoop/common/hadoop-3.1.3/ 集群规划 一、基础环境准备 准备三台虚拟机,使
阅读全文
摘要:四个主要模块: common:工具类,rpc框架 hdfs:分布式文件系统,主从架构 主上面的进程:namenode、secondarynamenode(不过一般不跟namenode在一个节点) 从上面的进程:datanode yarn:集群的资源调度框架,主从架构 主上面的进程:resourcem
阅读全文