2018 年 4月 4 日随笔档案 - Earendil

2018年4月4日

摘要：问题描述：数据包含了一百四十万用户对80万商品的打分。要利用基于物品的协同过滤来计算。如果直接两两计算140万维的向量相似度，肯定不行啊。问题分析：每个物品的向量虽然是140万维的，但是其实给一个物品打分的用户其实不多，这个矩阵是非常稀疏的。而且根据长尾问题来说，大部分物品只有很少的用户有过评阅读全文

posted @ 2018-04-04 09:07 Earendil 阅读(669) 评论(0) 推荐(0) 编辑

公告