摘要: 详见:https://www.cnblogs.com/Yanjy-OnlyOne/p/11195621.html 阅读全文
posted @ 2020-07-23 21:17 hisweetyGirl 阅读(166) 评论(0) 推荐(0) 编辑
摘要: #时间戳格式改为YYYY-mm-DD hh:MM:ss df['pdate']=pd.to_datetime(df['Timestamp'],unit='s') #从日期中快速取出月份 df_group=df.groupby([df["pdate"].dt.month,"Rating"])["Use 阅读全文
posted @ 2020-07-23 20:52 hisweetyGirl 阅读(948) 评论(0) 推荐(0) 编辑
摘要: 上图是获取2018年每个月温度最高的2天数据。 另一种解题思路 要得到销售排名前3位的城市,先进行排序。 详细见https://www.sohu.com/a/344992003_165070 阅读全文
posted @ 2020-07-23 20:15 hisweetyGirl 阅读(1149) 评论(0) 推荐(0) 编辑
摘要: 参考此文章:https://www.jianshu.com/p/e76861ed1815 写得很详细 map仅能传一下参数 map传入一个字典或一个函数都可。 apply可以传多个参数 apply注意asix值,asix=0,以列计算(按行扫数据),asix=1,以行计算(按列扫数据) applym 阅读全文
posted @ 2020-07-23 20:00 hisweetyGirl 阅读(292) 评论(0) 推荐(0) 编辑
摘要: 同样以股票数据为例 Series单层索引 ser=stocks.grougby('公司').['收盘'].mean() 返回以公司为维度作为索引的平均值。(ser值的含义:A公司的股票收盘平均值,B公司的股票收盘平均值,...X公司的股票收盘平均值) Series的分层索引Mulitindex se 阅读全文
posted @ 2020-07-23 19:48 hisweetyGirl 阅读(341) 评论(0) 推荐(0) 编辑
摘要: 分组统计在实际应用中是非常多的。比如:对不同地区的销售量的统计,不同班级的分数统计,同一月份的统计等。比如查询每个月最高气温。 先通过分组groapby方法查出每个月的聚合数据,而且再利于agg进行max计算。 group_data=df.groupby('month').agg({'bWendy' 阅读全文
posted @ 2020-07-23 19:32 hisweetyGirl 阅读(372) 评论(0) 推荐(0) 编辑