摘要: 我们可能会有些需求要求MapReduce的输出全局有序,这里说的有序是指Key全局有序。但是我们知道,MapReduce默认只是保证同一个分区内的Key是有序的,但是不保证全局有序。基于此,本文提供三种方法来对MapReduce的输出进行全局排序。 |文章目录| |: |1.生成测试数据 |2.使用 阅读全文
posted @ 2018-08-12 16:57 CoXie带你学编程 阅读(1376) 评论(0) 推荐(0) 编辑
摘要: 创新最主要的不是靠灵感,而是靠执行。 传统企业在数字化转型中,面临的很大问题就是创新问题,大数据也不例外,最近读到得到《何凡读书俱乐部》中关于创新的系列文章,有了一些共鸣和启发,这里结合大数据的创新实践分享一下自己的看法。 一、创新就是在行动中思考 首先讲一个团队建设的游戏,这个团队建设游戏叫“棉花 阅读全文
posted @ 2018-08-12 00:23 CoXie带你学编程 阅读(1296) 评论(0) 推荐(0) 编辑