hadoop - 随笔分类 - 习惯了蓝

yarn架构整理以及 hdfs yarn mapreduce三者整体的运行流程以及yarn三种调度器的区别

摘要：yarn的基础架构 mr-yarn-hdfs任务提交全流程图解 yarn三种调度器的区别阅读全文

posted @ 2022-05-23 11:12 习惯了蓝阅读(39) 评论(0) 推荐(0)

摘要：mapreduce工作流程分成maptask和reducetask俩个阶段。其实就类似于spark和flink中的map算子和 reduce算子主要关注这几个方面逻辑切片如何决定maptask并行度 maptask计算开始前，job如何提交然后知道将文件分成多少逻辑切片 fileinputFor 阅读全文

posted @ 2022-05-22 20:37 习惯了蓝阅读(46) 评论(0) 推荐(0)

namenode和secondary namenode之间的工作原理整理，以及datanode 的工作机制和原理

摘要：namenode和secondary namenode中涉及到的主要概念就是 1 元数据 2 fsimage (备份元数据) 3 edits （操作日志） namenode为了快速响应随机访问，所以把元数据放在内存，同时为了防止断电导致元数据丢失，在磁盘上存在一个备份元数据的fsimage。当在内存阅读全文

posted @ 2022-05-22 17:13 习惯了蓝阅读(260) 评论(0) 推荐(0)

hdfs的块大小以及hdfs的读写流程

摘要：hdfs上的文件是以块为单位进行存储的大小一般设置为128m，不能太小，也不能太大。详细情况看以下链接 hdfs块大小设置原因 hdfs的写数据流程（1）客户端向 NameNode 请求上传文件，NameNode 检查目标文件是否已存在，父目录是否存在。（2）NameNode 返回是否可以上阅读全文

posted @ 2022-05-21 20:52 习惯了蓝阅读(370) 评论(0) 推荐(0)

hdfs架构整理

摘要：hdfs组成架构有四个组件，分别是namenode,datanode,secondary namenode。 NameNode（nn）：就是Master，它是一个主管、管理者。（1）管理HDFS的名称空间；（2）配置副本策略；（3）管理数据块（Block）映射信息；（4）处理客户端读写请求阅读全文

posted @ 2022-05-21 19:41 习惯了蓝阅读(274) 评论(0) 推荐(0)

hadoop的第三方链接整理

摘要：1. 一个job的Maptask具体个数的确定 https://blog.51cto.com/u_15294985/2999282 阅读全文

posted @ 2021-11-04 21:43 习惯了蓝阅读(75) 评论(0) 推荐(0)

Hadoop在windows环境下进行开发的配置准备

摘要：工具需要 1. maven 2.Idea 3 hadoop安装包 4 bin编译完成包 5 jdk包步骤 1 下载hadoop安装包 https://hadoop.apache.org/ 自行选择需要版本解压到目标文件夹比如C:\hadoop 2. 下载版本对应的bin编译完成包，自己编译比阅读全文

posted @ 2021-10-07 11:48 习惯了蓝阅读(149) 评论(0) 推荐(0)

ssh Hadoop03 jps 报错：bash: jps: command not found

摘要：问题原因尽管每台都设置了/etc/profile文件：用来设置系统环境参数，比如$PATH. 这里面的环境变量是对系统内所有用户生效。但是没有设置~/.bashrc文件，而~/.bashrc文件是针对某一个特定的用户，环境变量的设置只对该用户自己有效。使用bash命令，只要以该用户身份运行命令行就阅读全文

posted @ 2021-09-27 16:49 习惯了蓝阅读(348) 评论(0) 推荐(0)

Could not find or load main class org.apache.hadoop.mapred.YarnChild

摘要：在hadoop集群配置搭建完，要使用wordcount 来实现一个小案例遇到了如下的问题经过查验，解决办法如下在yarn-site.xml 文件中添加如下property 然后source /etc/profile 生效。阅读全文

posted @ 2021-09-25 21:42 习惯了蓝阅读(426) 评论(0) 推荐(0)

Hadoop集群启动出现JAVA_HOME is not set and could not be found问题

摘要：sbin/start-dfs.sh启动集群出现问题只需要修改/etc/hadoop/hadoop-env.sh中设JAVA_HOME。这里是要添加的绝对路径再次启动问题就解决了阅读全文

posted @ 2021-09-24 23:52 习惯了蓝阅读(2567) 评论(0) 推荐(0)

ssh免密登录

摘要：SSH免密登录原理 1. cd 到家目录 cd /home/xst 执行 ls -al 可以看到隐藏文件.ssh 目前里面只有一个文件 2. ssh-keygen -t rsa 执行后可以看到 .ssh文件下生成公钥和私钥已经生成 3. 执行ssh-copy-id Hadoop03 把公钥分发给需阅读全文

posted @ 2021-09-24 20:56 习惯了蓝阅读(87) 评论(0) 推荐(0)

hadoop 安装

摘要：1. hadoop 下载，点击HTTP下载tar包 2.解压完后，配置环境变量，在/etc/profile路径下 3.输入hadoop，验证安装完成阅读全文

posted @ 2021-08-30 19:15 习惯了蓝阅读(69) 评论(0) 推荐(0)

习惯了蓝

随笔分类 - hadoop

公告