上一页 1 ··· 3 4 5 6 7 8 下一页
摘要: 代码1:# coding=gbk'''数据集:BX-Users.csv,包含用户的ID、位置和年龄。BX-Books.csv,包含图书的ISBN、标题、作者、发表年代、出版社和缩略。BX-Book-Ratings.csv, 包含用户对图书的评分信息。比较两种p(f,i)两种定义方式,给[年龄50]两... 阅读全文
posted @ 2015-04-13 10:26 porco 阅读(551) 评论(0) 推荐(0) 编辑
摘要: 定义:在开始阶段,没有大量用户数据的情况下,进行个性化推荐的问题。分类对策(提供非个性化推荐-热门推荐)用户冷启动-对新用户进行推荐A1.利用新用户的注册信息进行推荐 2.导入用户社交网站信息A3.要求用户对一些物品进行反馈物品冷启动-将新物品推荐给用户B1.利用物品的内容信息进行推荐系统冷启动-在... 阅读全文
posted @ 2015-04-13 10:25 porco 阅读(475) 评论(0) 推荐(0) 编辑
摘要: 算法思想:1.将用户对物品的反馈记录,转换为2分图2.使用随机游走算法,计算从用户节点u到物品节点i的概率,作为用户对物品的喜好(2分图)例子:数据集2分图AaAbBaBcCb(随机游走)分析:比如从A点出发,每一步,有$\alpha$的概率继续往下走,$1-\alpha$的概率返回A如果将所在位置... 阅读全文
posted @ 2015-04-13 09:49 porco 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 隐语义模型:物品 表示为长度为k的向量q(每个分量都表示 物品具有某个特征的程度)用户兴趣 表示为长度为k的向量p(每个分量都表示 用户对某个特征的喜好程度)用户u对物品i的兴趣可以表示为 其损失函数定义为- 使用随机梯度下降,获得参数p,q负样本生成:对于只有正反馈信息(用户收藏了,关注了... 阅读全文
posted @ 2015-04-09 21:13 porco 阅读(2931) 评论(0) 推荐(0) 编辑
摘要: 算法步骤:1.计算物品相似度2.根据用户购买记录,推荐相似物品物品相似度定义:A. 购买i的人里面,有多少比例购买了j 缺点(推荐系统需要能挖掘长尾信息,此处若j很热门,则w趋向于很大,则买了i的人都会被推荐j,热门商品更加热门)B. 在A的基础上,加入了对热门物品j的惩罚C. 活跃用户的贡献度应该... 阅读全文
posted @ 2015-04-09 09:20 porco 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 好的推荐系统:三赢 用户-找到自己感兴趣的东西 商家-增加了销量 网站-得到好的发聩,提升了推荐质量;提高了收入推荐系统评测方法:优点缺点1.离线实验只需要数据集,不需要用户参与,不需要实际系统;速度快,可测试大量算法;无法计算商业上关心的指标,如点击率、转化率等2.调查问卷可获得用户主管感受... 阅读全文
posted @ 2015-04-09 09:02 porco 阅读(471) 评论(0) 推荐(0) 编辑
摘要: ---恢复内容开始---算法步骤:1.计算用户相似度2.对于特定用户,选出k个最相似的用户,将这些用户评价过的前k好的物品推荐给该用户用户相似度 度量:其中|N(u)|表示用户u评价过的物品的数量,|N(i)|为物品i的流行度,即物品i被多少用户评价过这里物品流行度越高,它在相似度的度量上作用越小(... 阅读全文
posted @ 2015-04-09 08:32 porco 阅读(253) 评论(0) 推荐(0) 编辑
摘要: Gradient boostinggradient boosting 是一种boosting(组合弱学习器得到强学习器)算法中的一种,可以把学习算法(logistic regression,decision tree)代入其中。问题描述:给定一组数据{(x,y)}i,i=1,2...,N,使用函数F... 阅读全文
posted @ 2015-03-24 17:15 porco 阅读(509) 评论(0) 推荐(0) 编辑
摘要: 1.permutation test用途:用于检验两组数据是否出生于同一分布思路:如果产生于同一分布,两组数据混合,重新排列后,计算的基于两组数据的函数值(均值,中位数,方差等,下面程序中使用f指定)应该相差不大方法:library("gtools");permuTesttobs,1,0); } ... 阅读全文
posted @ 2015-03-20 17:01 porco 阅读(396) 评论(0) 推荐(0) 编辑
摘要: ---恢复内容开始---本文件对应logistic.pyamazonaccess介绍:根据入职员工的定位(员工角色代码、角色所属家族代码等特征)判断员工是否有访问某资源的权限logistic.py(python)的关键:1.通过组合组合几个特征来获取新的特征 例如:组合MGR_ID ROLE_FAM... 阅读全文
posted @ 2015-03-20 16:30 porco 阅读(391) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 下一页