基于概率的项目相似度之并行方法
摘要:
推荐系统是个好东西,数据越大一般情况下效果越好,其挑战就是运算量问题,并行处理是近几年烽烽火火的一个主题,本文就从并行的角度来实现上一篇博客的算法 实现平台:Hadoop-1.0.3 ; Hive-0.8.1 ; Eclipse SDKVersion: 3.3.2 资源:Hadoop 14 个节点 =====================================步骤=======================================Step1:底层数据的构建create external table dm_fan_prob_basic(user string,... 阅读全文
posted @ 2013-04-16 10:49 JueFan_C 阅读(417) 评论(0) 推荐(0) 编辑