摘要: [原文]:http://www.sobuhu.com/archives/567最近发现一个很好玩的Python库,可以方便的使用在Python下编写MapReduce任务,直接使用Hadoop Streaming在Hadoop上跑。对于一般的Hadoop而言,如果任务需要大量的IO相关操作(如数据库查询、文件读写等),使用Python还是Java、C++,性能差别不大,而如果需要大量的数据运算,那可能Python会慢很多(语言级别上的慢),参考这里。最常见的如日志分析、Query统计等,都可以直接用Python快速完成。Python作为一种快速开发语言,优美、简洁的语法征服了很多人,现在很多的 阅读全文
posted @ 2013-04-10 21:28 HOLD 阅读(714) 评论(0) 推荐(0) 编辑