协同过滤(推荐方法)——数据挖掘

这个方法是找到与你相似的人,把这个相似的人的爱好推荐给你。

首先找到相似的人。

计算方法是距离计算。

如曼哈顿距离:(x1,y1) (x2,y2)   |x1-x2|+|y1-y2|

曼哈顿距离优点:计算速度快

适用于Facebook等

勾股定理:计算直线距离,欧几里得距离

 

根号下 (x1-x2)2  + (y1-y2)2

 

以上两种方法也可以用来计算多维的数据,以上两种方法在数据完整的时候效果最好,如何处理数据缺失?this is a problem

总结以上两种方法,为闵可夫斯基距离

其中:

 

  • r = 1 该公式即曼哈顿距离
  • r = 2 该公式即欧几里得距离
  • r = ∞ 极大距离

 

 

 

 

研究python,进行编程计算。

 

posted on 2016-01-20 15:03  cbwcwy  阅读(1002)  评论(0编辑  收藏  举报