上一页 1 ··· 5 6 7 8 9 10 11 下一页
摘要: HDFS的快照 一个snapshot(快照)是一个全部文件系统、或者某个目录在某一时刻的镜像 快照应用在如下场景中: 防止用户的错误操作 备份 试验/测试 灾难恢复 HDFS的快照操作 开启快照 hdfs dfsadmin -allowSnapshot /input 创建快照 hdfs dfs -c 阅读全文
posted @ 2019-09-11 00:08 DaBai的黑屋 阅读(492) 评论(0) 推荐(0) 编辑
摘要: Hadoop是什么? 狭义上: HDFS:分布式文件存储系统 MapReduce:分布式计算框架 YARN:资源管理任务调度 广义上: HDFS:分布式文件存储系统 MapReduce:分布式计算框架 YARN:资源管理任务调度 特指apache一款由java开发,开源的大户数据处理平台软件 had 阅读全文
posted @ 2019-09-11 00:06 DaBai的黑屋 阅读(270) 评论(0) 推荐(0) 编辑
摘要: hadoop hdfs 垃圾回收机制 何为垃圾回收 开启垃圾回收站 把删除的文件首先放置在回收站中 等待配置的时间结束 进行真正的数据删除 如何开始 vim core-site.xml<property><name>fs.trash.interval</name><value>1440</value 阅读全文
posted @ 2019-09-11 00:05 DaBai的黑屋 阅读(1097) 评论(0) 推荐(0) 编辑
摘要: 一、 MapReduce jobHistory JobHistory用来记录已经finished(结束)的mapreduce运行日志,日志信息存放于HDFS目录中,默认情况下没有开启此功能,需要在mapred-site.xml中配置并手动启动。 1. 修改mapred-site.xml cd /ex 阅读全文
posted @ 2019-09-11 00:04 DaBai的黑屋 阅读(464) 评论(0) 推荐(0) 编辑
摘要: hadoop初体验 namnode format操作 首次启动集群需要针对hdfs 操作 操作只需要进行一次 通常在namenode所在节点进行 format中主要创建了hadoop运行时依赖的一些文件夹和文件 Storage directory /export/data/hadoopdata/df 阅读全文
posted @ 2019-09-11 00:03 DaBai的黑屋 阅读(199) 评论(0) 推荐(0) 编辑
摘要: Hadoop2.x的安装与配置(文档有详细) (一)Hadoop安装部署的预备条件 安装Linux 安装JDK hadoop集群搭建 hadoop发行版本 社区版:官方版本 apache社区维护 优点:功能最新的 免费 缺点:稳定性 兼容性不好 https://archive.apache.org/ 阅读全文
posted @ 2019-09-11 00:00 DaBai的黑屋 阅读(1067) 评论(1) 推荐(1) 编辑
摘要: 1. Hadoop介绍 Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。 狭义上说,Hadoop指Apache这款开源框架,它的核心组件有: HDFS(分布式文件系统): 阅读全文
posted @ 2019-09-10 23:56 DaBai的黑屋 阅读(4399) 评论(1) 推荐(1) 编辑
摘要: 是什么? 分布式文件存储系统(是一个跨多台机器的文件存储系统) HDFS设计,特性: 分布式:标准的主从架构(NameNode DataNode) 一次写入多次读取:数据侧重于分析 注重数据吞吐量,交互延迟高,不适合做网盘 侧重于大文件存储,不利于小文件,小文件吃内存 基本原理: 对外如同一个黑盒子 阅读全文
posted @ 2019-09-10 23:51 DaBai的黑屋 阅读(246) 评论(0) 推荐(0) 编辑
摘要: HDFS架构 NameNode DataNode Secondary NameNode 元数据存储细节 <!--more--> 一、NameNode 是整个文件系统的管理节点。它维护着整个文件系统的文件目录树,文件/目录的元信息和每个文件对应的数据块列表。接收用户的操作请求。文件包括: hdfs-s 阅读全文
posted @ 2019-09-10 23:50 DaBai的黑屋 阅读(164) 评论(0) 推荐(0) 编辑
摘要: hadoop archive的使用 产生背景:hdfs架构设计不利于小文件存储 文件不管多小 都需要元数据描述记录 如果集群小文件过多 可能磁盘使用情况很低 但是内存使用确很高 俗称 小文件吃内存 档案的功能:通过mr程序 把多个小文件 合并成一个档案文件 archive的使用 档案的创建 hado 阅读全文
posted @ 2019-09-10 23:49 DaBai的黑屋 阅读(444) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 下一页
Live2D