2011年5月31日
摘要: map阶段package com.taobao;import java.io.*;import java.util.*;import org.apache.hadoop.filecache.DistributedCache;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapred.*;import org.apache.hadoop.util.StringUtils;publi 阅读全文
posted @ 2011-05-31 14:05 一个人的天空@ 阅读(524) 评论(0) 推荐(0) 编辑
摘要: 1map阶段输入:MovieID,UserID,Rating,Date输出:<MovieID Rating,Date>import java.io.*;import java.util.*;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapred.*;public class MyMapper {public static class MapClass extends MapReduceBaseimplements Mapper& 阅读全文
posted @ 2011-05-31 14:03 一个人的天空@ 阅读(864) 评论(0) 推荐(0) 编辑
摘要: 原始数据:$head -10 mv_0006890.txt6890:1735266,1,2004-04-021008399,1,2004-06-222360117,2,2003-11-081294425,2,2004-03-15439931,4,2004-03-271583311,1,2004-03-112431832,3,2005-02-13620771,2,2004-03-201110906,1,2004-03-04结果数据:user_id movie_id rating$head -10 ratings_0.txt499040 9419 32071637 9419 4896780 941 阅读全文
posted @ 2011-05-31 14:02 一个人的天空@ 阅读(410) 评论(0) 推荐(0) 编辑
摘要: http://www.csie.ntu.edu.tw/~r95007/thesis/svdnetflix/report/report.pdfhttp://eecs.wsu.edu/~vjakkula/MLProject.pdfhttp://michielvanwezel.com/papers/kagie_vdloos_vwezelV2.pdfhttp://cseweb.ucsd.edu/users/elkan/KddNetflixWorkshop.pdfhttp://www.cs.uic.edu/~liub/KDD-cup-2007/proceedings/The-Netflix-Prize- 阅读全文
posted @ 2011-05-31 14:01 一个人的天空@ 阅读(1885) 评论(1) 推荐(0) 编辑