2020 年 7月 23 日随笔档案 - hisweetyGirl

2020年7月23日

摘要：详见:https://www.cnblogs.com/Yanjy-OnlyOne/p/11195621.html 阅读全文

posted @ 2020-07-23 21:17 hisweetyGirl 阅读(167) 评论(0) 推荐(0) 编辑

16.Pandas将时间戳格式改为YYYY-mm-DD hh:MM:ss (to_datetime()方法)和从日期中快速取成月份

摘要： #时间戳格式改为YYYY-mm-DD hh:MM:ss df['pdate']=pd.to_datetime(df['Timestamp'],unit='s') #从日期中快速取出月份 df_group=df.groupby([df["pdate"].dt.month,"Rating"])["Use 阅读全文

posted @ 2020-07-23 20:52 hisweetyGirl 阅读(970) 评论(0) 推荐(0) 编辑

15.Pandas实现快速定位排名前几位或后几位的数据

摘要：上图是获取2018年每个月温度最高的2天数据。另一种解题思路要得到销售排名前3位的城市，先进行排序。详细见https://www.sohu.com/a/344992003_165070 阅读全文

posted @ 2020-07-23 20:15 hisweetyGirl 阅读(1159) 评论(0) 推荐(0) 编辑

14.Pandas的数据转换函数map,apply,applymap

摘要：参考此文章:https://www.jianshu.com/p/e76861ed1815 写得很详细 map仅能传一下参数 map传入一个字典或一个函数都可。 apply可以传多个参数 apply注意asix值，asix=0，以列计算（按行扫数据），asix=1，以行计算（按列扫数据） applym 阅读全文

posted @ 2020-07-23 20:00 hisweetyGirl 阅读(294) 评论(0) 推荐(0) 编辑

13.Pandas分层索引Multiindex

摘要：同样以股票数据为例 Series单层索引 ser=stocks.grougby('公司').['收盘'].mean（）返回以公司为维度作为索引的平均值。（ser值的含义：A公司的股票收盘平均值，B公司的股票收盘平均值，...X公司的股票收盘平均值） Series的分层索引Mulitindex se 阅读全文

posted @ 2020-07-23 19:48 hisweetyGirl 阅读(347) 评论(0) 推荐(0) 编辑

12.Pandas中Groupby方法

摘要：分组统计在实际应用中是非常多的。比如：对不同地区的销售量的统计，不同班级的分数统计，同一月份的统计等。比如查询每个月最高气温。先通过分组groapby方法查出每个月的聚合数据，而且再利于agg进行max计算。 group_data=df.groupby('month').agg({'bWendy' 阅读全文

posted @ 2020-07-23 19:32 hisweetyGirl 阅读(380) 评论(0) 推荐(0) 编辑

hisweety

公告