集体智慧编程读书笔记(第二章)
1.关于相似度评价体系
欧几里德距离和皮尔逊相关度
欧几里德距离:
- # 计算所有差值的平方和
1 sum_of_squares=sum([pow(prefs[person1][item]-prefs[person2][item],2) 2 for item in prefs[person1] if item in prefs[person2]])
说明:pow()计算差值平方 prefs、person1、person2为传入参数
- 取倒数(1+差值平方和)
1 return 1/(1+sqrt(sum_of_squares))
说明:2者相关度越高,则该值越趋向于1
皮尔逊相关度:
最佳拟合线
皮尔逊相关公式: