kaggle竞赛: 沃尔玛销量预测

竞赛地址:

https://www.kaggle.com/c/walmart-recruiting-store-sales-forecasting

 

第一名方案:

https://www.kaggle.com/c/walmart-recruiting-store-sales-forecasting/discussion/8125

 

基本思路是应用R的forecast包,对每个商店每个部门的销售时序数据应用stl分解,获得周期性数据(seasonal)和趋势性数据(trend),对trend应用arima或ets进行预测,然后加上上一年度的seasonal数据,得到最终预测数据。

使用该方案直接就能进入top 5%。但还有提升空间。由于评分公式对holiday周的权重很大,而美国节日的定义方法并不一样,比如圣诞节是固定的1224,而感恩节是第11月的第四个星期四,所以需要对节日进行对齐。对齐后进入top 2%。

最后,对每个部门,建立日期(index)、商店(columns)这样一个矩阵,对该矩阵就行pca处理,减少不同商店带来的噪声信息。



作者:匠人的OP
链接:https://www.zhihu.com/question/21229371/answer/245618105
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

posted @ 2019-02-28 18:06  爱知菜  阅读(70)  评论(0编辑  收藏  举报