摘要: 充分利用hadoop的map输出自动排序功能,能够有效提高计算效率。Hadoop streaming框架默认情况下会以'/t’作为分隔符,将每行第一个'/t’之前的部分作为key,其余内容作为value,如果没有'/t’分隔符,则整行作为key;这个key/tvalue对又作为该map对应的redu 阅读全文
posted @ 2017-08-05 11:40 fisherinbox 阅读(1673) 评论(0) 推荐(0) 编辑