摘要: 记得来填坑啊 阅读全文
posted @ 2016-10-21 18:00 simple_wxl 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 从图中可以看出,map阶段的shuffle: 例如word count,当内存缓冲区满的时候会写到磁盘,一个spill,每个spill,进行分区,排序,最后将同一个分区word合并在一起,写入到磁盘中 reduce阶段:将不同map的相同分区的部分,进行merge,最后结果为reduce的输入 hi 阅读全文
posted @ 2016-10-21 17:51 simple_wxl 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 推荐系统实践 第一章:好的推荐系统 推荐系统实验方法: 离线实验 用户调查 在线实验:AB测试,将用户分成不同的组,然后不同组里面用不同算法,最后根据后台日志数据库,分析得出哪些算法比较好 推荐系统的测评指标 1、 用户满意度(用户调查,在线实验) 2、 预测准确度(离线) 打分系统: TOPN 推 阅读全文
posted @ 2016-10-21 17:40 simple_wxl 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 训练集上面,加一个bool型的开关 做预测的时候,不需要打开开关,而是所有的数乘以p, 实际工业界做的时候是: 在训练的时候都除以p,在做预测的时候什么时候都不用干 阅读全文
posted @ 2016-10-21 15:13 simple_wxl 阅读(1187) 评论(0) 推荐(0) 编辑