推荐功能的两种算法

    最近做了一个类似淘宝的根据用户的操作,判断出用户对哪些产品感兴趣,并按照一定关系推荐给用户其它产品。查询了一些资料,结果发现时下,很多地方都用到了推荐,淘宝,优酷,迅雷等等,有时候确实让人称心如意,推荐的产品非常和你的胃口,不过也有时推荐的让你莫名其妙。其实推荐的算法有很多种,而且不一定有固定的模式,它会根据产品的特性,推荐的目的,以及其它方面的要求而不同。
不过具体的不一样,但是其原理性的大概有以下几种算法。专门研究算法的人写的太深奥了,全部都是数学术语,太难懂了,我还是以自己的理解来说明下吧。
1、Apriori算法
    Apriori算法是很复杂的,基本思想如下:
    首先找出所有的已收集到的集合,即根据操作记录的集合。然后由这个集合产生强关联规则。然后使用第1步的集合产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递推的方法。
    我理解的基本步骤如下。
    基本步骤是
    a、根据操作收集对象的属性;

    b、根据已收集的属性为条件,从包含所有数据的库中搜索与之相关的对象;

    c、按照一定的规则过滤,剩下的向用户推荐。

    举例来说,例如在淘宝买东西,用户买了手机,电脑,衣服等,每买一件都记录下来,作为推荐的依据;那么如何推荐呢,手机和电脑属于数码类,那么推荐就可以推荐相机等数码产品,同时,还可以推荐其它品牌的手机或电脑。根据衣服推荐亦相同。当然了,这只是很简单的推荐,不一定能对用户的心思。要想做准确的推荐在每一步中都要进行处理。
    2、Slope One算法
    使用基于Slope One算法的推荐需要以下数据:
    1. 有一组用户
    2. 有一组Items(文章, 商品等)
    3. 用户会对其中某些项目打分(Rating)表达他们的喜好
    Slope One算法要解决的问题是, 对某个用户, 已知道他对其中一些Item的Rating了, 向他推荐一些他还没有Rating的Items, 以增加销售机会. :-)

    一个推荐系统的实现包括以下三步:
    1. 计算出任意两个Item之间Rating的差值
    2. 输入某个用户的Rating记录, 推算出对其它Items的可能Rating值
    3. 根据Rating的值排序, 给出Top Items;

    第一步:例如我们有三个用户和4个Items, 用户打分的情况如下表.

    在第一步中我们的工作就是计算出Item之间两两的打分之差, 也就是使说计算出以下矩阵:

    考虑到加权算法, 还要记录有多少人对这两项打了分(Freq), 我们先定义一个结构来保存Rating:

   用一个Dictionary来保存这个结果矩阵:

    接下来我们来实现SlopeOne类. 首先创建一个RatingDifferenceCollection来保存矩阵, 还要创建HashSet来保持系统中总共有哪些Items:

C#实现代码:http://download.csdn.net/detail/yysyangyangyangshan/4097454

posted on 2012-02-28 17:56  c语言源码  阅读(467)  评论(0编辑  收藏  举报

导航