mac osx 系统 brew install hadoop 安装指南
mac osx 系统 brew install hadoop 安装指南
- brew install hadoop
- 配置 core-site.xml:配置hdfs文件地址(记得chmod 对应文件夹,否则无法正常启动hdfs)和namenode的rpc通行端口
- 配置mapred-site.xml 中的map reduce通信端口
- 配置hdfs-site.xml 中的datanode 副本数。
- 格式化hdfs文件系统
- 启动Hadoop 和 yarn namenode datanode mapred , 即:运行 start_all.sh
- (可选)在hdfs中创建当前用户的地址: hadoop fs -mkdir -p /user/fan
- 开工,web ui 地址默认为:http://localhost:50070。
遇到的问题:
一, 如在hdfs -put ~/file fileonhdfs 时, 出现error:WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Invalid directory in dfs.data.dir
原因是:
- core-site.xml中设置的文件系统已满,需重新设置,并再次-format。
- core-site.xml中设置的hdfs文件系统所在文件夹需要chmod 777
二, 如在hadoop fs -ls . 命令时出现: ls: '.': No such file or directory'
- 请执行:
hadoop fs -mkdir -p /user/[current login user]
配置文件demo:
配置core-site.xml、hdfs-site.xml、mapred-site.xml
* core-site.xml:
- <configuration>
- <property>
- <name>hadoop.tmp.dir</name>
- <value>/usr/local/tmp/hadoop/hadoop-${user.name}</value>
- <description>A base for other temporary directories.</description>
- </property>
- <property>
- <name>fs.default.name</name>
- <value>hdfs://localhost:8020</value>
- </property>
- </configuration>
* hdfs-site.xml:
- <configuration>
- <property>
- <name>dfs.replication</name>
- <value>1</value>
- </property>
- </configuration>
* mapred-site.xml:
- <configuration>
- <property>
- <name>mapred.job.tracker</name>
- <value>localhost:8021</value>
- </property>
- <property>
- </configuration>
其实这些都是基本配置, 网上一大把。配置的值的说明可以参考这3个地址:
写道
http://hadoop.apache.org/common/docs/r0.20.2/core-default.html
http://hadoop.apache.org/common/docs/r0.20.2/hdfs-default.html
http://hadoop.apache.org/common/docs/r0.20.0/mapred-default.html
http://hadoop.apache.org/common/docs/r0.20.2/hdfs-default.html
http://hadoop.apache.org/common/docs/r0.20.0/mapred-default.html
2.3)格式化hadoop的文件系统hdfs。 执行命令 hadoop namenode -format
作者:
fandyst
出处: http://www.cnblogs.com/todototry/
关注语言: python、javascript(node.js)、objective-C、java、R、C++
兴趣点: 互联网、大数据技术、大数据IO瓶颈、col-oriented DB、Key-Value DB、数据挖掘、模式识别、deep learning、开发与成本管理
产品:
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。
出处: http://www.cnblogs.com/todototry/
关注语言: python、javascript(node.js)、objective-C、java、R、C++
兴趣点: 互联网、大数据技术、大数据IO瓶颈、col-oriented DB、Key-Value DB、数据挖掘、模式识别、deep learning、开发与成本管理
产品:
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。