王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第十讲Hadoop图文训练课程:剖析Hadoop的重要配置文件
本讲主要剖析Hadoop重要的配置文件。
王家林的“云计算分布式大数据Hadoop实战高手之路”之完整发布目录
云计算分布式大数据实战技术Hadoop交流群:312494188,每天都会在群中发布云计算实战性资料,欢迎大家加入!
在前面我们安装单机版Hadoop以及Hadoop集群的时候,我们使用的只是可以工作的最小化配置项,有很多重要的配置项都还没有提及。
首先看一下我们前面对core-site.xml这个配置文件的配置信息:
“fs:default.name”这个配置项是整个Hadoop文件系统的入口,Hadoop系统所有的节点关于这个文件的配置必须是统一的,在主节点当中namenode必须配置成主机名,不能配置成localhost;
接下来看一下hdfs-site.xml这个配置文件,前面已经对该文件的配置信息是:
其中的
用于保存NameNode的fsimage和editlog文件,我们进入我们我们配置的目录:
其中“image”这个文件用于保存fsimage文件的内容,“current”这个文件用于保存editlog的信息。NameNode的信息是非常重要,要保存在尽量安全的环境中,例如固态硬盘或者存储当中;
配置文件中的:
配置信息是用于Hadoop文件系统存放数据,我们在Hadoop的文件系统中放入一份数据后,Hadoop需要把数据放置到不同的块中,这个配置信息就是记录这些数据分块放置目录的信息;
hdfs-site.xml这个配置文件还有一个非常重要的配置项:fs.checkpoint.dir,这个配置项用于SecondaryNameNode用于存放fsimage和editlog的目录;
Android架构师、高级工程师、咨询顾问、培训专家;
通晓Android、HTML5、Hadoop,迷恋英语播音和健美;
致力于Android、HTML5、Hadoop的软、硬、云整合的一站式解决方案;
国内最早(2007年)从事于Android系统移植、软硬整合、框架修改、应用程序软件开发以及Android系统测试和应用软件测试的技术专家和技术创业人员之一。
HTML5技术领域的最早实践者(2009年)之一,成功为多个机构实现多款自定义HTML5浏览器,参与某知名的HTML5浏览器研发;
Hadoop源码级专家,曾负责某知名公司的类Hadoop框架开发工作,专注于Hadoop一站式解决方案的提供,同时也是云计算分布式大数据处理的最早实践者之一,Hadoop的狂热爱好者,不断的在实践中用Hadoop解决不同领域的大数据的高效处理和存储,现在正负责Hadoop在搜索引擎中的研发中国电信的多次Hadoop培训,花旗银行的Hadoop内训,金立手机的Hadoop内训等,著有《云计算分布式大数据Hadoop实战高手之路---从零开始》《云计算分布式大数据Hadoop实战高手之路---高手崛起》《云计算分布式大数据Hadoop。实战高手之路---高手之巅》等;
超过10本的IT畅销书作者;