摘要: 类名PearsonCorrelationSimilarity名称:皮尔逊相关系数(Pearson Correlation Coefficient)皮尔逊相关系数一般用于计算两个定距变量间联系的紧密程度,它的取值在 [-1,+1] 之间。公式sx,sy是x和y的样品标准偏差。原理:用来反映两个变量线性... 阅读全文
posted @ 2014-05-07 13:44 baoendemao 阅读(1130) 评论(0) 推荐(0) 编辑
摘要: 在Mahout中,用户的喜好被抽象为一个Preference,包含了userId,itemId和偏好值(user对item的偏好)。Preference是一个接口,它有一个通用的实现是GenericPreference。因为用户的喜好数据是大规模的,我们通常会选择把它放入集合或者数组。同时,由于Ja... 阅读全文
posted @ 2014-05-07 13:19 baoendemao 阅读(313) 评论(0) 推荐(0) 编辑
摘要: Mahout下载与安装1、下载Mahout。到地址[1]可以找到镜像地址。我们下载Mahout 0.5。请将mahout-distribution-0.5.tar.gz和mahout-distribution-0.5-src.zip都下载下来,前者是正式软件,后者是源文件,用于导入eclipse以便... 阅读全文
posted @ 2014-05-07 11:32 baoendemao 阅读(349) 评论(0) 推荐(0) 编辑