摘要: User CF 和 Item CF 都依赖于相似度的计算,因为只有通过衡量用户之间或物品之间的相似度,才能找到用户的“邻居”,才能完成推荐。上文简单的介绍了相似度的计算,但不完全,下面就对常用的相似度计算方法进行详细的介绍:1. 基于皮尔森相关性的相似度 —— Pearson correlation... 阅读全文
posted @ 2015-07-16 15:09 六月心悸 阅读(253) 评论(0) 推荐(0) 编辑
摘要: 协同过滤 —— Collaborative Filtering协同过滤简单来说就是根据目标用户的行为特征,为他发现一个兴趣相投、拥有共同经验的群体,然后根据群体的喜好来为目标用户过滤可能感兴趣的内容。协同过滤推荐 —— Collaborative Filtering Recommend协同过滤推荐是... 阅读全文
posted @ 2015-07-16 14:43 六月心悸 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 原博地址:http://blog.fens.me/hadoop-mahout-maven-eclipse/前言基于Hadoop的项目,不管是MapReduce开发,还是Mahout的开发都是在一个复杂的编程环境中开发。Java的环境问题,是困扰着每个程序员的噩梦。Java程序员,不仅要会写Java程... 阅读全文
posted @ 2015-07-16 14:10 六月心悸 阅读(422) 评论(0) 推荐(0) 编辑
摘要: mahout API英文解释:https://builds.apache.org/job/Mahout-Quality/javadoc/推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以Mahout针对推荐数据进行了优化。Preference在Mahout中,用户的喜好被抽象为... 阅读全文
posted @ 2015-07-16 14:03 六月心悸 阅读(342) 评论(0) 推荐(0) 编辑