Spark scala groupBy后求和

val goalsDF = Seq(
  ("messi", 2),
  ("messi", 1),
  ("pele", 3),
  ("pele", 1)
).toDF("name", "goals")

goalsDF.show()

+-----+-----+
| name|goals|
+-----+-----+
|messi|    2|
|messi|    1|
| pele|    3|
| pele|    1|
+-----+-----+

import org.apache.spark.sql.functions._

goalsDF
  .groupBy("name")
  .agg(sum("goals"))
  .show()
+-----+----------+
| name|sum(goals)|
+-----+----------+
| pele|         4|
|messi|         3|
+-----+----------+

转自:
https://mungingdata.com/apache-spark/aggregations/

posted @ 2020-12-30 18:12 船长博客阅读(1404) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

Spark scala groupBy后求和

公告