SortBy

复制代码
package com.shujia.spark.core

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Demo10Sort {
  def main(args: Array[String]): Unit = {

    val conf: SparkConf = new SparkConf()
      .setAppName("map")
      .setMaster("local")

    //spark  上下文对象
    val sc = new SparkContext(conf)

    val listRDD: RDD[Int] = sc.parallelize(List(1, 2, 123, 3, 4, 23, 5, 6, 7, 8))

    /**
      * sortBy: 指定一个排序的列,默认是升序
      */

    val sortRDD: RDD[Int] = listRDD.sortBy(i => i, false)

    sortRDD.foreach(println)

    val kvRDD: RDD[(String, Int)] = sc.parallelize(List(("java", 100), ("spark", 20), ("hadoop", 12321)))

    /**
      * sortByKey: 通过key进行排序
      *
      */
    val sortByKeyRDD: RDD[(String, Int)] = kvRDD.sortByKey()

    sortByKeyRDD.foreach(println)
  }
}
复制代码

 

posted @   坤坤无敌  阅读(324)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
阅读排行:
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· DeepSeek在M芯片Mac上本地化部署
· 葡萄城 AI 搜索升级:DeepSeek 加持,客户体验更智能
点击右上角即可分享
微信分享提示