2013年4月12日

基于概率的相似度定义方法

摘要: 本文的主要内容来自百分点科技问题定义:本文在基于item协同过滤算法的框架下,定义了一种新的item相似度计算方法。该方法是一种基于概率的算法,即两个item的相似度为一个用户随机的选择item,同时选到这两个item的概率。本文的实验结果表明,本文的算法准确率要比传统的算法要好,并且本文也给出了该算法在hadoop上的实现过程。方法:1. 基本定义首先定义了几个概念:分别是选择item y的用户集合和用户u选择的item集合。如果从item的角度来看,商品x被用户u选择户u选择的概率应该为这个item(x)的度比上所有user的数,即如果从user的角度来看,用户u选择商品x的概率应该为这个 阅读全文

posted @ 2013-04-12 11:47 JueFan_C 阅读(1295) 评论(0) 推荐(0) 编辑

导航