会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
悦光阴
请不要假装很努力,因为结果不会陪你演戏。
博客园
首页
管理
2021年1月11日
Databricks 第4篇:pyspark.sql 分组统计和窗口
摘要: 对数据分析时,通常需要对数据进行分组,并对每个分组进行聚合运算。在一定意义上,窗口也是一种分组统计的方法。 分组数据 DataFrame.groupBy()返回的是GroupedData类,可以对分组数据应用聚合函数、apply()函数和pivot()函数。 常用的聚合函数是: count():统计
阅读全文
posted @ 2021-01-11 08:38 悦光阴
阅读(3823)
评论(0)
推荐(0)
编辑
公告