hadoop与spark的处理技巧(一)Top N处理技巧

1.MR的topN处理方案,假设所有输入Key都唯一

 

2.MR的topN处理方案,假设输入Key不唯一

3.spark的topN处理方案,假设所有输入Key都唯一,不使用top()和takeOrdered()函数

4.spark的topN处理方案,假设输入Key不唯一,不使用top()和takeOrdered()函数

5.spark的topN处理方案,假设输入Key不唯一,使用takeOrdered()函数

 

 

posted @ 2020-05-19 16:13  疯狂摇头的青蛙  阅读(195)  评论(0编辑  收藏  举报