摘要: 题目: 思路: 首先从 ratings.dat 中计算出电影id,平均评分。得出一个中间表。 通过分析,中间表比 movis.dat 要小,所以优先考虑将中间表加载到内存中,写入到一个hashmap中,做 map join。 Map 端处理movies.dat 中的数据,根据电影 id 关联 has 阅读全文
posted @ 2019-09-02 18:37 Keep-Smile 阅读(3073) 评论(0) 推荐(0) 编辑