Apriori In Python

Prerequisite.

  A对B的支持度,指的是事件A和事件B同时发生的概率,Support=P(AB).

  置信度,指的是事件A已经发生了,再发生事件B的概率,就是概率论中的条件概率Confidence=P(B|A)=P(AB)/P(A)

  如果事件A代表买牛奶,事件B代表买面包:

    假设总共有33%的人买了牛奶 那么 P(A) = 0.33

    假设总共有20%的人同时购买了牛奶和面包,那么Support(A->B) = P(AB)=20%

    Confidence(A->B)=P(B|A)=P(AB)/P(A) = 0.2/0.33 = 0.6

    Confidence(A->B)=60% 就代表所有买牛奶的人中,60%的也购买了面包。

    因此认为60%的可信度,买了牛奶的人会买面包。

 

  如果事件A中包含K个元素,那么称这个事件A为K项集:

    比如同时买牛奶,面包和水就是一个3项集。

  如果事件A中包含K个元素,并且A事件发生的概率大于最小支持度,那么称这个事件为频繁K项集:

    比如同时买牛奶,面包和水的人占所有人的比例大于30(最小支持度),那么这就是一个频繁3项集。

  

 

Python 代码

  TODO

  

 

 

 

参考:

  1.http://www.tanglei.name/apriori-algorithm-in-python/

 

posted on 2015-03-23 19:22  刀疤2  阅读(218)  评论(0编辑  收藏  举报

导航