Python学习笔记--PySpark的基础学习(二)
filter方法(过滤想要的数据进行保留)
具体实现(保留奇数):
具体实现(保留偶数):
distinct方法(对RDD进行去重,返回新的RDD)
且无需传参
具体实现(去重):
sortBy方法(排序,基于我们制定的排序依据)
具体实现:
降序排序,第二个参数为False
具体实现(保留奇数):
具体实现(保留偶数):
且无需传参
具体实现(去重):
具体实现:
降序排序,第二个参数为False