摘要: # coding=gbk'''选择用户反馈的物品将评分>3定义为喜欢'''import pandas as pdimport numpy as npimport copy#获取区分度def getDiff(userRates,movie): like=dict() dislike=dic... 阅读全文
posted @ 2015-04-13 13:16 porco 阅读(318) 评论(0) 推荐(0) 编辑
摘要: 代码1:# coding=gbk'''数据集:BX-Users.csv,包含用户的ID、位置和年龄。BX-Books.csv,包含图书的ISBN、标题、作者、发表年代、出版社和缩略。BX-Book-Ratings.csv, 包含用户对图书的评分信息。比较两种p(f,i)两种定义方式,给[年龄50]两... 阅读全文
posted @ 2015-04-13 10:26 porco 阅读(551) 评论(0) 推荐(0) 编辑
摘要: 定义:在开始阶段,没有大量用户数据的情况下,进行个性化推荐的问题。分类对策(提供非个性化推荐-热门推荐)用户冷启动-对新用户进行推荐A1.利用新用户的注册信息进行推荐 2.导入用户社交网站信息A3.要求用户对一些物品进行反馈物品冷启动-将新物品推荐给用户B1.利用物品的内容信息进行推荐系统冷启动-在... 阅读全文
posted @ 2015-04-13 10:25 porco 阅读(475) 评论(0) 推荐(0) 编辑
摘要: 算法思想:1.将用户对物品的反馈记录,转换为2分图2.使用随机游走算法,计算从用户节点u到物品节点i的概率,作为用户对物品的喜好(2分图)例子:数据集2分图AaAbBaBcCb(随机游走)分析:比如从A点出发,每一步,有$\alpha$的概率继续往下走,$1-\alpha$的概率返回A如果将所在位置... 阅读全文
posted @ 2015-04-13 09:49 porco 阅读(432) 评论(0) 推荐(0) 编辑