集体智慧编程读书笔记(第二章)

1.关于相似度评价体系

欧几里德距离和皮尔逊相关度

欧几里德距离:

  • # 计算所有差值的平方和
    1 sum_of_squares=sum([pow(prefs[person1][item]-prefs[person2][item],2)
    2                         for item in prefs[person1] if item in prefs[person2]])

    说明:pow()计算差值平方 prefs、person1、person2为传入参数

  • 取倒数(1+差值平方和)
    1 return 1/(1+sqrt(sum_of_squares))

    说明:2者相关度越高,则该值越趋向于1

皮尔逊相关度:

  最佳拟合线

  皮尔逊相关公式:

     

      

     

posted @ 2016-12-30 10:31  fubst0318  阅读(95)  评论(0编辑  收藏  举报