2013年12月20日

mahout中canopy算法应用于广告点击用户类别识别

摘要: canopy算法基本思想如下:将数据集向量化得到一个线性集合后放入内存,选择两个距离阈值:T1和T2,其中T1 > T2,T1和T2的值可以用交叉校验来确定;从线性集合中任取一点P,用低计算成本方法快速计算点P与所有Canopy之间的距离(如果当前不存在Canopy,则把点P作为一个Canopy),... 阅读全文

posted @ 2013-12-20 18:13 AI001 阅读(167) 评论(0) 推荐(0) 编辑

导航