上一页 1 ··· 59 60 61 62 63 64 65 66 67 ··· 78 下一页
摘要: 推荐系统中所使用的混合技术介绍http://www.tuicool.com/articles/ruYnAn原文http://www.resyschina.com/2013/10/ensemble-recommendation.html文/陈运文在推荐系统实际运用中,各种混合技术是其中一项极为重要的核心技术。在工程实践中我们发现,混合技术对提升推荐效果、改进推荐系统的性能等都有重要意义,因此本文对该专题进行如下的一些总结和介绍。引言在这个信息爆炸的时代,消费者面临众多选择、未知的领域、过载的信息时,往往无所适从;然而与此同时,内容的生产者(例如商家)也在苦苦寻觅合适的用户,寻找最便捷的渠道,而解 阅读全文
posted @ 2014-04-02 12:15 Django's blog 阅读(626) 评论(0) 推荐(0) 编辑
摘要: 协同过滤算法一、介绍:http://blog.csdn.net/v_july_v/article/details/7184318http://blog.163.com/lnhenrylee@126/blog/static/2414832520123269713813/http://zh.wikipedia.org/wiki/%E5%8D%94%E5%90%8C%E9%81%8E%E6%BF%BE#.E6.9C.AA.E4.BE.86.E7.99.BC.E5.B1.95http://zh.wikipedia.org/wiki/Slope_one基于协同过滤的三个子类:基于用户的推荐(通过共同口味 阅读全文
posted @ 2014-04-02 12:09 Django's blog 阅读(575) 评论(0) 推荐(0) 编辑
摘要: 1,首先使用基于item的协同过滤推荐。2,然后得出每个用户推荐的得分。3,得分>3分的就当成这个用户的推荐Item然后专门计算7月15日-8月15日之间的用户点击行为,把查看、收藏、购物车这3种行为收集起来,如果这3种行为次数较多,那么用户在9月份购买此产品的可能性会很大。已测F1 r感觉上来直接用协同过滤不好,关键是topN,这个N怎么取,取好了效果应该也不错吧?还感觉购物车和收藏可能是大部分噪音的来源,lz要是单纯相加计算的话,不太好吧?阿里内部人士说用LR+协同过滤,当时就蒙了。。。现在想,是不是可以用LR预测某用户下个月是否会买?这个要是能确定F1会不会上升一个档次呢?可惜特征 阅读全文
posted @ 2014-04-02 11:51 Django's blog 阅读(256) 评论(0) 推荐(0) 编辑
摘要: http://bbs.aliyun.com/read/154433.html?spm=5176.7189909.0.0.gzyohy&fpage=2看到主办方之前发的一篇文章里提到,这个购买行为 和 传统的评分过滤问题 还是很不一样的。但为什么亚马逊 会使用 item-cf等协同过滤算法呢?这里用item-cf算法为什么会这么差?难道亚马逊 和天猫上的购买行为 有差别?协同过滤的关键是要知道用户的显性反馈,即评分。这个数据集根本就没有给评分,即便是利用购买来做评分,利用binary rate来做,正负例比例失调,购买带来的信息太少。其他行为作为隐形反馈很难合理的加进SVD++进去。总体 阅读全文
posted @ 2014-04-02 10:58 Django's blog 阅读(369) 评论(0) 推荐(0) 编辑
摘要: http://bbs.aliyun.com/read/153103.html?spm=5176.7189909.0.0.KWGWap一、同为推荐,大不同! 不知道同学们是否经常在天猫购物,但是相信大家一定听过音乐,看过电影,读过新闻和小说。大家在享受各种娱乐信息的时候,正在被网站的后台悄悄地记录着你的信息,分析着你的偏好,然后向你推荐越来越喜欢的内容。整个过程也许你并没有明显的感知,但是你会慢慢上瘾,喜欢上它,比如爱上虾米。这其实都是推荐算法的功劳。现在,你们也有机会用自己的算法让大家爱上购物。但是,音乐推荐、视频推荐、新闻推荐和品牌推荐的不同之处还是要注意的,要去思考的。 不都是推荐么?有什 阅读全文
posted @ 2014-04-02 10:22 Django's blog 阅读(309) 评论(0) 推荐(0) 编辑
摘要: 一、cygwin的安装我们可以到Cygwin的官方网站下载Cygwin的安装程序,地址是:http://www.cygwin.com/或者直接使用下载连接来下载安装程序,下载连接是:http://www.cygwin.com/setup.exe安装组件:binutilsgccgcc-mingwgdbDevel分支下: autoconf2.5automake1.9binutils gcc gcc-core gcc-g++ gcc-mingw-core gcc-mingw-g++ gdb subvisionBase分支下:sed,主要是在eclipse下编译用的net分支下:openssh和ope 阅读全文
posted @ 2014-04-01 22:44 Django's blog 阅读(2573) 评论(0) 推荐(0) 编辑
摘要: 1.发掘用户兴趣1)啤酒和尿布的故事2)用户行为数据:session log、impression log、click log。这些日志记录了用户的行为:浏览、购买、点击、评分、评论3)用户行为:显性反馈行为、隐性反馈行为2.用户行为分析1)长尾分布:发f(x)=ax^k2)协同过滤算法:仅仅基于用户行为数据设计的推荐算法。包含:基于邻域(基于用户的协同过滤算法userCF、基于物品的协同过滤算法itemCF)、隐语义模型、基于图的随机游走算法。3)userCF:给用户推荐和他兴趣相似的其他用户喜欢的物品。计算用户的相似度。Digg在应用,相比较MostPopular算法,准确率和召回率都要高 阅读全文
posted @ 2014-03-21 18:17 Django's blog 阅读(649) 评论(0) 推荐(0) 编辑
摘要: 1.互联网搜索及推荐发展1)早期的孤岛式网站,门户网站出现,网站导航,属于针对网站的推荐。但是内容的获取还是需要到相应网站上去浏览。2)搜索引擎:用户可以主动检索内容3)推荐系统:主动的推荐用户感兴趣的物品,广告定向投放等。推荐系统发展:热销推荐->个性化推荐->捆绑式推荐。netflix:研究的是预测用户看了电源后会给出怎样的评分。更有意义的应该是用户可能会喜欢的电源。2.推荐系统评测指标1)用户满意度:调查问卷或网站上收集2)预测准确度:平方根误差(RMSE)、平均绝对误差(MAE)3)召回率(recall)4)准确率(precision)5)覆盖率:如何发掘长尾商品。所有物品 阅读全文
posted @ 2014-03-21 15:48 Django's blog 阅读(520) 评论(0) 推荐(0) 编辑
摘要: http://my.oschina.net/zhangjiawen/blog/1856251基于用户的协同过滤算法:基于用户的协同过滤算法是推荐系统中最古老的的算法,可以说是这个算法的诞生标志了推荐系统的诞生。该算法在1992年被提出,并应用于邮件过滤系统,1994年被GroupLens用于新闻过滤。在一个在线个性化推荐系统中,当一个用户A需要个性化推荐时,可以先找到和他有相似兴趣的其他用户,然后把那些用户喜欢的而用户A没有接触过的物品推荐给A。这种方法称为基于用户的协同过滤算法。给定用户u和用户v,令N(u)表示用户u曾经有过正反馈的物品集合,通过余弦相似度计算用户的相似度。由于很多用户相互 阅读全文
posted @ 2014-03-11 16:30 Django's blog 阅读(5203) 评论(0) 推荐(0) 编辑
摘要: http://blog.fens.me/hadoop-mahout-mapreduce-itemcf/Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。从2011年开始,中国进入大数据风起云涌的时代,以Hadoop为代表的家族软件,占据了大数据处理的广阔地盘。开源界 阅读全文
posted @ 2014-03-11 15:45 Django's blog 阅读(1429) 评论(0) 推荐(0) 编辑
上一页 1 ··· 59 60 61 62 63 64 65 66 67 ··· 78 下一页