转:[大数据竞赛]算法讨论


1,首先使用基于item的协同过滤推荐。
2,然后得出每个用户推荐的得分。
3,得分>3分的就当成这个用户的推荐Item

然后专门计算7月15日-8月15日之间的用户点击行为,把查看、收藏、购物车这3种行为收集起来,如果这3种行为次数较多,那么用户在9月份购买此产品的可能性会很大。

 

 

已测

F1 < 0.5%

原因:用户少,商品多

 

 

 

上周没用任何算法,单纯把关联数据全部关联起来,f1-score=2.3% p>r
感觉上来直接用协同过滤不好,关键是topN,这个N怎么取,取好了效果应该也不错吧?
还感觉购物车和收藏可能是大部分噪音的来源,lz要是单纯相加计算的话,不太好吧?

阿里内部人士说用LR+协同过滤,当时就蒙了。。。
现在想,是不是可以用LR预测某用户下个月是否会买?这个要是能确定F1会不会上升一个档次呢? 可惜特征值没建立好啊,完全没效果
继续讨论啊

 

 

 

posted @ 2014-04-02 11:51  Django's blog  阅读(256)  评论(0编辑  收藏  举报