摘要: 首先, 引入这节需要的 csv 文件 (已上传) 输出: 根据 'city'字段分组: 输出: 循环输出分组后的数据: 输出: 获取其中的某一组数据: 输出: 取每个组的最大值: 取每个组的平均值: 获取每个组的常规信息: 输出图表: 以上, 就是关于 Pandas 分组的相关知识, enjoy~~ 阅读全文
posted @ 2019-02-23 22:36 rachelross 阅读(2515) 评论(1) 推荐(0) 编辑
摘要: 首先, 还是新建一个 jupyter notebook, 然后引入 csv 文件(此文件我已上传到博客园): 输出:从上面的输出截图, 可以看到有很多不合理的数据, 这时可以用 replace() 函数来处理: 输出:这时, 就还剩下 event 列里的 0 还没有改, 因为没办法简单粗暴地把数字 阅读全文
posted @ 2019-02-23 11:12 rachelross 阅读(1322) 评论(0) 推荐(0) 编辑
摘要: 首先, 读入一个 csv 文件: 输出: 查看一下 day 列的数据类型: 输出: 所以目前 day 列里数据类型是字符串. 把 day 列里的数据转成时间戳, 加上第二个参数 parse_dates=['day'] 即可: 再查看一下 day 列的数据类型: 输出: 把 day 列设置为索引列: 阅读全文
posted @ 2019-02-23 01:25 rachelross 阅读(1362) 评论(0) 推荐(2) 编辑