摘要: 大数据团队搞数据质量评测。自动化质检和监控平台是用django,MR也是通过python实现的。(后来发现有orc压缩问题,python不知道怎么解决,正在改成java版本) 这里展示一个python编写MR的例子吧。 抄一句话:Hadoop Streaming是Hadoop提供的一个编程工具,它允 阅读全文
posted @ 2016-12-10 11:53 扎心了老铁 阅读(3270) 评论(0) 推荐(0) 编辑