原谅我是一个有个性的90后,吹毛求疵不是我的菜,吐槽才是我真爱。

  最近在做电影推荐算法的评分算法总结,虽然去年某度神的社区比赛有涉及到这样一个题目,就是给定用户对电影的评分数据,以及相关的一些用户数据,然后预测用户对其他电影的评分。根据某社区某些天比赛的排名快照来看,排名靠前大神已经能将误差控制在0.6以下了。下图为佐证:

  

  大神毕竟是大神,作为大神,他们在自己的评分模型上不断的修改,不断的进步~然而,看看某专利上的算法,某专利就是用了SVD结合了KNN的算法,申请了专利,结果呢?看看他的误差曲线。如下图:

  用了迭代的算法,使用了50个近邻,得到了0.7左右的误差。不得不说,中国的专利的确有那么点,不,是有很多的水分啊。亏我使用的随机统计模型还得到了0.75左右的误差,没有迭代,没有近邻。还是比赛更加实际啊。是骡是马,拉出来溜溜就知道了。大家不断的修改自己的模型,然后不断竞争,的确更能刺激工程的发展哪~顺便说一下,这专利上还说实时呢,我真看不出来这一点!迭代的过程逐渐累积,近邻数量逐渐增加,算法消耗时间越来越多,由这个曲线可以看到,这个模型很容易就达到误差下界了吧。

  吐槽差不多结束了,这个专利所在的价值,估计就是给人一种算法进步希望的感觉吧,把两种算法结合起来,优缺点互补,然后算法的精度却....唉,看来我也可以写专利了啊。咳咳。