摘要: 一、赛题介绍1、赛题数据:已知x个歌曲艺人在阿里音乐上的用户记录数据(2015年03月01日-2015年08月30日)用户行为表:一行记录某个用户某日对某首歌曲的操作,包括:播放,下载,收藏歌曲艺人表:一行记录某个艺人在某日发行某首歌曲的基本信息,其中包括该收歌曲的专辑收录时间,初始播放量,歌唱语言以及歌唱者的性别组成预测这x个艺人在之后的2个月(2015年09月01日-2015年10月30日),... 阅读全文
posted @ 2016-08-30 17:08 萱草yy 阅读(5901) 评论(8) 推荐(1) 编辑
摘要: 根据小结1,用复赛数据对艺人分类为高播放量(前23名)艺人和低播放量艺人:以08均值最高的艺人1b322374de83520bf45aa8928e18e70a为研究对象选择7、8月画出时序图,除了7月初(7月7日)前,之后基本是平稳的。 按每周7天计算每月平均播放量如下,可以发现这个分布规律与工作节假日规律相关 根据之前金陵书生提供的听歌年龄分布,大概在25到31岁所占比重最大,这类人大部分是上... 阅读全文
posted @ 2016-08-30 16:55 萱草yy 阅读(603) 评论(0) 推荐(0) 编辑
摘要: 分类艺人:选取08月总值较高的14个艺人作为研究对象用户:根据袁光浩PPT中对第11个线路画的每个用户刷卡次数的统计表我们以用户user_id=b15e8846dc61824c1242a6b36796117b(播放量最高的艺人)为例,画出该艺人的用户183的播放量图像:(127135*0.995=126499.3)如下是将用户总小到大取前126499个用户的图像:横轴是用户按播放量从小到大的编号,... 阅读全文
posted @ 2016-08-30 11:21 萱草yy 阅读(842) 评论(0) 推荐(0) 编辑