Hadoop - 随笔分类 - Zhbeii

格式化hdfs

摘要：bin/hdfs namenode -format sbin/start-dfs.sh 阅读全文

posted @ 2022-03-29 16:55 Zhbeii 阅读(57) 评论(0) 推荐(0)

摘要：Yarn生产环境核心参数阅读全文

posted @ 2022-01-19 19:24 Zhbeii 阅读(35) 评论(0) 推荐(0)

MapReduce

摘要：MapReduce MapTask收集我们的map()方法输出的kv对，放到内存缓冲区中从内存缓冲区不断溢出本地磁盘文件，可能会溢出多个文件多个溢出文件会被合并成大的溢出文件在溢出过程及合并的过程中，都要调用Partitioner进行分区和针对key进行排序 ReduceTask根据自己的分区阅读全文

posted @ 2022-01-19 19:05 Zhbeii 阅读(50) 评论(0) 推荐(0)

HDFS小文件处理

摘要：缺点：存储层面：1个文件块，占用namenode多大内存150字节 128G能存储多少文件块？ 128 g* 1024m1024kb1024byte/150字节 = 9.1亿文件块每个小文件都有一份元数据，其中包括文件路径，文件名，所有者，所属组，权限，创建时间等，这些信息都保存在Namenod 阅读全文

posted @ 2022-01-19 19:02 Zhbeii 阅读(304) 评论(0) 推荐(0)

HDFS

摘要：简介定义： HDFS（Hadoop Distributed File System），它是一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色。 HDFS的使用场景：适合一次写入，多次读出的场景。一个文件经过创建、写入和关阅读全文

posted @ 2022-01-19 16:51 Zhbeii 阅读(114) 评论(0) 推荐(0)

mapreduce的输出路径报错

摘要：新手刚学hadoop,啥也不懂,跟着视频上的老师敲,因为懒,在代码中少加了一个目录, 重点是最后一句,输出路径不能是已经存在的,最后一个目录地址必须是还没有被创建的,解决把以前建的目录删掉或者在代码中加一个还不存在的目录地址 2021-11-06 16:38:56,759 WARN [org.apa 阅读全文

posted @ 2021-11-06 16:49 Zhbeii 阅读(1151) 评论(0) 推荐(0)

Loading

Zhbeii

随笔分类 - Hadoop

公告