摘要: 推荐系统的用户行为分为显性反馈和隐性反馈 ,显性反馈数据集可以明确区分正负样本(如评分数据);隐性反馈数据集只有正样本(用户喜欢什么),没有负样本(用户不喜欢什么)。 隐性反馈数据集上生成负样本的方法: (1)对于一个用户,用他所有没有过行为的物品作为负样本。 (2)对于一个用户,从他没有过行为的物 阅读全文
posted @ 2019-07-18 10:35 xd_xumaomao 阅读(1109) 评论(0) 推荐(0) 编辑
摘要: 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为:“对于有根树 T 的两个结点 p、q,最近公共祖先表示为一个结点 x,满足 x 是 p、q 的祖先且 x 的深度尽可能大(一个节点也可以是它自己的祖先)。” 阅读全文
posted @ 2019-07-15 20:59 xd_xumaomao 阅读(203) 评论(0) 推荐(0) 编辑
摘要: sort(a,a+n); bool comp(const int &a,const int &b) { return a>b; } bool Comp(const P &a1,const P &a2) { return a1.w<a2.w;//从小到大 } //对vector排序 sort(v.be 阅读全文
posted @ 2019-07-15 20:02 xd_xumaomao 阅读(128) 评论(0) 推荐(0) 编辑
摘要: vector 初始化 (1)vector<int> a(10); //定义了10个整型元素的向量(尖括号中为元素类型名,它可以是任何合法的数据类型),但没有给出初值,其值是不确定的。 (2)vector<int> a(10,1); //定义了10个整型元素的向量,且给出每个元素的初值为1 (3)ve 阅读全文
posted @ 2019-07-15 19:55 xd_xumaomao 阅读(1062) 评论(0) 推荐(0) 编辑
摘要: SGD 权重更新公式 \[W \leftarrow W - \eta \frac{{\partial L}}{W}\] SGD的缺点 学习率的设置非常需要技巧,学习率设置的过大,容易跳过最优点,学习率设的过小,又容易困于局部最优或鞍点,所以一般要设置一个随着训练批次衰减的学习率 所以特征的学习率都一 阅读全文
posted @ 2019-07-13 23:55 xd_xumaomao 阅读(1322) 评论(0) 推荐(0) 编辑
摘要: BGD每次迭代都用了所有的样本,每一轮都是朝着极小值方向更新的,当函数只有一个极小值点时BGD能过够比较快的收敛的全局最优,当函数有多个极小值点时BGD容易陷入局部最优,而且当数据量很大时BDG需要消耗大量的内存,计算代价也会很高。SGD每次只用小批量的数据来计算,内存消耗小,计算代价也更低,而且S 阅读全文
posted @ 2019-07-13 20:53 xd_xumaomao 阅读(825) 评论(0) 推荐(0) 编辑
摘要: 一. 基于用户的协同过滤 算法思想: 当给用户A做个性化推荐时,先找到和他兴趣相似的用户,然后把这些用户喜欢的、而用户A没有听说过的物品推荐给A 。 算法步骤: (1) 找到和目标用户兴趣相似的用户集合。(2) 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。 用户相似度计算公 阅读全文
posted @ 2019-07-12 11:34 xd_xumaomao 阅读(372) 评论(0) 推荐(0) 编辑
摘要: 参考博客 https://blog.csdn.net/strivenoend/article/details/79842836 注意:把 git remote add origin git@github.com:wangjiax9/beautifulDay.git 换成 git clone git@ 阅读全文
posted @ 2019-07-12 10:31 xd_xumaomao 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 余弦相似度和欧式距离的区别 1. 计算公式 余弦相似度: \[\cos \left( {A,B} \right) = \frac{{A \cdot B}}{{{{\left\| A \right\|}_2}{{\left\| B \right\|}_2}}} = \frac{{\sum\limits 阅读全文
posted @ 2019-07-11 17:12 xd_xumaomao 阅读(1982) 评论(0) 推荐(0) 编辑
摘要: TF-IDF(term frequency–inverse document frequency,词频-逆向文件频率)是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语 阅读全文
posted @ 2019-07-11 11:55 xd_xumaomao 阅读(273) 评论(0) 推荐(0) 编辑