hadoop streaming 记录
最近想简单的学下streaming,主要是使用python,python+hadoop在前篇博文中也有例外介绍,挺有意思.C++的话有机会也想尝试下.
记录看到的一些网页,作为备忘记录下来
http://hadoop.apache.org/docs/r0.19.2/cn/streaming.html#Hadoop+Streaming 中文的,虽然版本比较老了
http://hadoop.apache.org/docs/stable/streaming.html 最新版本
http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/
http://dongxicheng.org/mapreduce/hadoop-streaming-programming/
http://dongxicheng.org/mapreduce/hadoop-streaming-advanced-programming/
http://www.cnblogs.com/luchen927/archive/2012/01/16/2323448.html 这2个我没有看完
http://blog.csdn.net/xiaotom5/article/details/8092035
http://apc999.blogspot.com/2010/03/hadoop-related.html 有不少配置 还是不错
关于xml的处理,还没尝试