hadoop streaming 记录

最近想简单的学下streaming,主要是使用python,python+hadoop在前篇博文中也有例外介绍,挺有意思.C++的话有机会也想尝试下.

记录看到的一些网页,作为备忘记录下来

 

http://hadoop.apache.org/docs/r0.19.2/cn/streaming.html#Hadoop+Streaming 中文的,虽然版本比较老了

http://hadoop.apache.org/docs/stable/streaming.html 最新版本

http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/

 

http://dongxicheng.org/mapreduce/hadoop-streaming-programming/

http://dongxicheng.org/mapreduce/hadoop-streaming-advanced-programming/

 

http://www.cnblogs.com/luchen927/archive/2012/01/16/2323448.html 这2个我没有看完

http://blog.csdn.net/xiaotom5/article/details/8092035

 

http://apc999.blogspot.com/2010/03/hadoop-related.html 有不少配置 还是不错

 

关于xml的处理,还没尝试

http://blog.sina.com.cn/s/blog_3e48b19f0100zu8r.html

http://dongyajun.iteye.com/blog/1315185

posted on 2013-02-05 23:21  阿笨猫  阅读(397)  评论(0编辑  收藏  举报