2012 年 6月 20 日随笔档案 - BrightSea

2012年6月20日

摘要：在现实中广泛使用的推荐系统一般都是基于协同过滤算法的，这类算法通常都需要计算用户与用户或者项目与项目之间的相似度，对于数据量以及数据类型不同的数据源，需要不同的相似度计算方法来提高推荐性能，在mahout提供了大量用于计算相似度的组件，这些组件分别实现了不同的相似度计算方法。下图用于实现相似度计算的组件之间的关系：图1、项目相似度计算组件图2、用户相似度计算组件下面就几个重点相似度计算方法做介绍：皮尔森相关度类名：PearsonCorrelationSimilarity原理：用来反映两个变量线性相关程度的统计量范围：[-1,1]，绝对值越大，说明相关性越强，负相关对于推荐的意义小。说明：1、. 阅读全文

posted @ 2012-06-20 09:57 BrightSea 阅读(11322) 评论(1) 推荐(1) 编辑

DataInsight

跨越数据到知识的鸿沟

公告