摘要: 合并数据 根据任意个用户或电影属性对评分数据进行聚合操作 按性别计算每部电影的平均得分(产生了另一个DataFrame,其内容是电影平均分,行标为电影名称,列标为性别) 对title进行分组, 利用size() 得到一个含有各个电影分组大小的 Series对象: 为了了解女性观众最喜欢的电影,我们可 阅读全文
posted @ 2017-09-27 23:20 douzujun 阅读(1858) 评论(1) 推荐(0) 编辑
摘要: 接下来对时区进行计数,这里使用两种方法,一种使用Python标准库,另一个比较简(使用pandas)。 使用标准款,简洁版 要它对时区进行处理,传入time_zones传入即可: 得到前10位的时区及计数值: 使用collection.Counter类,使这个任务变的简单: DataFrame是pa 阅读全文
posted @ 2017-09-27 20:30 douzujun 阅读(1153) 评论(0) 推荐(0) 编辑