Python学习笔记--PySpark的基础学习(二)

filter方法(过滤想要的数据进行保留)

具体实现(保留奇数):

具体实现(保留偶数):

distinct方法(对RDD进行去重,返回新的RDD)

且无需传参

具体实现(去重):

sortBy方法(排序,基于我们制定的排序依据)

具体实现:

降序排序,第二个参数为False

posted @ 2022-12-27 18:54  yesyes1  阅读(13)  评论(0编辑  收藏  举报