2014年7月28日

海量推荐系统:mapreduce的方法

摘要: 1. Motivation2. MapReduceMapReduce是一种数据密集型并行计算框架。待处理数据以“块”为单位存储在集群机器文件系统中(HDFS),并以(key, value)的键值对形式保存。当任务启动时,系统将计算任务分配给存储数据的相应机器。MapReduce计算任务可以划分为两个阶段:MapReduce数据流图3. scalable similarity-based neig... 阅读全文

posted @ 2014-07-28 12:52 zjgtan 阅读(1827) 评论(0) 推荐(0) 编辑

导航