鲍礼彬

深度学习、机器学习、Hadoop、Spark

博客园 首页 新随笔 联系 订阅 管理

Hadoop-2.0 目录简介

一、目录结构

将下载的压缩包解压:

解压后文件夹如下:

 

 

二、各文件夹目录结构

1、bin:Hadoop2.0的最基本管理脚本使用脚本所在目录。这些脚本是sbin目录下管理脚本的基础实现,我们可以直接用这些脚本管理和使用Hadoop。

2、etc:这个目录里的文件只要接触过Hadoop的人都很熟悉。Hadoop配置文件目录。首先是从Hadoop1.0继承来的三个文件core-site.xmlhdfs-site.xmlmapred-site.xml,然后还有一个Hadoop2.0新增的一个配置文件yarn-site.xml

 

3、include:这个是对外提供的编程库头文件,具体动态库和静态库在lib目录里。这些头文件均用C++定义的。学过C++语言的人可以用C++语言访问HDFS或者编写MapReduce程序。

(没错这就是咱们熟悉的.h文件。)

4、lib:该目录包含了Hadoop对外提供的编程动态库和静态库,与include目录里的头文件结合使用。

 

5、libexec:这个是各个服务对应的Shell配置文件所在目录,可用于配置日志输出目录、启动参数(比如JVM参数)等基本信息。

6、sbin:Hadoop管理脚本所在目录,主要包括HDFS和YARN中各类服务的启动和关闭脚本。

7、share:Hadoop各个模块编译后的JAR包所在目录。

在这个目录:hadoop-2.4.0\share\doc\hadoop\api\index.html可以查看API

 

 
 
posted on 2015-01-17 22:12  鲍礼彬  阅读(267)  评论(0编辑  收藏  举报