摘要: 一、推荐系统实验方法 离线实验、在线实验、用户调查 二、评测指标 1. 用户满意度 2. 预测准确度: (1) 评分预测:RMSE(均方根误差)、MAE(平方绝对误差) (2) TopN推荐:Precision、Recall 3. 覆盖率 覆盖率(coverage)描述一个推荐系统对物品长尾的发掘能 阅读全文
posted @ 2019-07-11 20:58 xd_xumaomao 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 余弦相似度和欧式距离的区别 1. 计算公式 余弦相似度: \[\cos \left( {A,B} \right) = \frac{{A \cdot B}}{{{{\left\| A \right\|}_2}{{\left\| B \right\|}_2}}} = \frac{{\sum\limits 阅读全文
posted @ 2019-07-11 17:12 xd_xumaomao 阅读(1953) 评论(0) 推荐(0) 编辑
摘要: TF-IDF(term frequency–inverse document frequency,词频-逆向文件频率)是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语 阅读全文
posted @ 2019-07-11 11:55 xd_xumaomao 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 1. 序号编码 如成绩可以分为高,中,低,序号编码保留了大小关系 2. 独热编码 (1)可以使用稀疏向量存储来节省空间。 (2)可以配合特征选择等方法降维 3. 二进制编码 二进制编码相对于独热编码来说更节省空间。 阅读全文
posted @ 2019-07-11 11:14 xd_xumaomao 阅读(177) 评论(0) 推荐(0) 编辑