随笔分类 -  推荐

推荐系统算法、代码、实践
摘要:本文将要讨论基于矩阵分解的推荐算法,这一类型的算法通常会有很高的预测精度,也活跃于各大推荐系统竞赛上面,前段时间的百度电影推荐最终结果的前10名貌似都是把矩阵分解作为一个单模型,最后各种ensemble,不知道正在进行的阿里推荐比赛(http://102.alibaba.com/competition/addDiscovery/index.htm),会不会惊喜出现。。。。好了,闲话不扯了,本文打算写一篇该类型推荐算法的入门篇目录一,基于矩阵分解的推荐算法相关理论介绍二,C++代码实现三,总结跟展望一下四,后续计划一,基于矩阵分解的推荐算法相关理论介绍 我们知道,要做推荐系统,最基本的一个数.. 阅读全文
posted @ 2014-04-08 13:51 kobeshow 阅读(23623) 评论(8) 推荐(5) 编辑
摘要:本文从互联网收集并整理了推荐系统的架构,其中包括一些大公司的推荐系统框架(数据流存储、计算、模型应用),可以参考这些资料,取长补短,最后根据自己的业务需求,技术选型来设计相应的框架。后续持续更新并收集。。。 图1 界面UI那一块包含3块东西:1) 通过一定方式展示推荐物品(物品标题、缩略图、简介等);2) 给的推荐理由;3) 数据反馈改进个性化推荐;关于用户数据的存放地方:1)数据库/缓存用来实时取数据;2) hdfs文件上面; 抽象出来的三种推荐方式 图2 图3 图3中,推荐引擎的构建来源于不同的数据源(也就是用户的特征有很多种类,例如统计的、行为的、主题的)+不同的... 阅读全文
posted @ 2014-02-26 16:13 kobeshow 阅读(39248) 评论(10) 推荐(8) 编辑
摘要:以下内容是转至盛大创新研究院官方博客的一篇文章http://in.sdo.com/?p=1707,文中几乎涵盖了当今主流的推荐系统开源软件,我把全文都贴过来了,不过与原文不同的是我把有些已经停止更新/或者更新很慢的都往后面排了。另外也写写自己的一些使用总结。 原文开始: 收集和整理了目前互联网上能找到的开源推荐系统,并附上了个人的一些简单点评(未必全面准确),这个列表是目前为止比较全面的了,希望对大家了解掌握推荐系统有帮助(文/陈运文)SVDFeature由上海交大的同学开发,采用C++语言,代码质量很高。去年我们参加KDD竞赛时用过,很好很方便,而且出自咱们国人之手,所以置顶推荐!项目地址. 阅读全文
posted @ 2014-02-22 15:00 kobeshow 阅读(4001) 评论(0) 推荐(1) 编辑
摘要:整理归纳一下《推荐系统实践》和《推荐系统导论》两本书的知识点,文中排版格式可能会有点乱,如有问题请指正。OK,闲话不说,先上2张图 对推荐系统的建模数据进行分析,代表型数据:1)无上下文的隐形反馈数据;2) 无上下文的显性反馈数据;3) 有上下文的隐形反馈数据;4)有小上下文的显性反馈数据,其中显性的反馈数据就是用户对物品的评分,而隐形的就是用户对物品的浏览,时长等数据(不同的领域,用户对物品的行为种类不一样),像我之前的做的都全是用有上下文的隐形反馈,都是通过点击、登陆、时长归纳出来的用户对物品的评分。 有了用户数据以后,可以做一些行为的分析:1) 用户活跃度和物品流行度的分布(用户... 阅读全文
posted @ 2014-02-22 13:59 kobeshow 阅读(3524) 评论(2) 推荐(0) 编辑
摘要:Slope One 算法 是一种基于评分的预测算法, 本质上也是一种基于项目的算法。与一般的基于项目的算法不同, 该算法不计算项目之间的相似度, 而是用一种简单的线性回归模型进行预测(可以扩展) 算法易于实现, 计算速度快, 可扩展性好, 同时对数据稀疏性有较好的适应性。 例如下面表格里有3个用户对4个物品的评分101102103104UserX53.5UserY2542UserZ4.53.514 求物品两两之间的差值平均分: 物品102和101:{(3.5-5)+(5-2)+(3.5-4.5)}/3=0.5/3 物品103跟101:{(4-2)+(1-4.5)}/2=-... 阅读全文
posted @ 2014-02-18 10:30 kobeshow 阅读(4572) 评论(0) 推荐(0) 编辑