Django's blog

2014年4月2日

摘要： http://www.janscon.com/multiarray/rs_used_svd.html【声明】本文主要参考自论文《A SINGULAR VALUE DECOMPOSITION APPROACH FOR. RECOMMENDATION SYSTEMS》1、简介该文章中提出两个创新点，首先先将User与Item分类，然后根据分类将矩阵分成相应的“子矩阵”，对这些矩阵进行相应的SVD不仅会提高准确率还会降低计算复杂度；另外一个创新点是在于使用三维矩阵，然后通过矩阵分解成、与子矩阵后再进行SVD分析，这篇文章的结果表示引入tags会提高推荐性能。2、用户评分矩阵评分矩阵3、进行奇异值分解阅读全文

posted @ 2014-04-02 15:45 Django's blog 阅读(1122) 评论(0) 推荐(0)

Logistic Regression--逻辑回归算法汇总**

摘要： http://www.cnblogs.com/biyeymyhjob/archive/2012/07/18/2595410.html转自别处有很多与此类似的文章也不知道谁是原创因原文由少于错误所以下文对此有修改并且做了适当的重点标记(横线见的内容没大明白并且有些复杂，后面的运行流程依据前面的得出的算子进行分类)初步接触谓LR分类器(Logistic Regression Classifier)，并没有什么神秘的。在分类的情形下，经过学习之后的LR分类器其实就是一组权值w0,w1,...,wm.当测试样本集中的测试数据来到时，这一组权值按照与测试数据线性加和的方式，求出一个z值：z = w 阅读全文

posted @ 2014-04-02 15:39 Django's blog 阅读(840) 评论(0) 推荐(0)

Netflix推荐系统：从评分预测到消费者法则

摘要： http://in.sdo.com/?p=11原文链接：Netflix recommendations: beyond the 5 stars(Part 1),(Part 2)原文作者：Xavier Amatriainand Justin Basilico前言Nexflix是一家提供在线视频流媒体服务和DVD租赁业务的公司，也是著名的Netflix大奖赛的发起者。如果读者希望进一步了解Netflix，建议读一下和讯上的一篇文章：Netflix：从传统DVD租赁向流媒体华丽转身以及爱范儿上的：Netflix成功的背后：高薪，高标准，高淘汰率，股票，无限制休假，恐惧文化，垃圾便当午餐在这篇博文中，阅读全文

posted @ 2014-04-02 15:30 Django's blog 阅读(1150) 评论(0) 推荐(0)

从决策树学习谈到贝叶斯分类算法、EM、HMM

摘要：转自：http://blog.csdn.net/v_july_v/article/details/7577684从决策树学习谈到贝叶斯分类算法、EM、HMM （Machine Learning & Data Mining交流群：8986884）引言最近在面试中，除了基础 & 算法 & 项目之外，经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然，这完全不代表你将来的面试中会遇到此类问题，只是因为我的简历上写了句：熟悉常见的聚类 & 分类算法而已)，而我向来恨对一个东西只知其皮毛而不得深入，故写一个有关数据挖掘十大算法的系列文章以作为自己备试之用阅读全文

posted @ 2014-04-02 15:16 Django's blog 阅读(902) 评论(0) 推荐(0)

数据挖掘中决策树算法实现——Bash

摘要：数据挖掘中决策树算法实现——Bash博客分类：数据挖掘决策树bash非递归实现标准信息熵数据挖掘决策树bash非递归实现标准信息熵一、决策树简介：关于决策树，几乎是数据挖掘分类算法中最先介绍到的。决策树，顾名思义就是用来做决定的树，一个分支就是一个决策过程。每个决策过程中涉及一个数据的属性，而且只涉及一个。然后递归地，贪心地直到满足决策条件(即可以得到明确的决策结果)。决策树的实现首先要有一些先验（已经知道结果的历史）数据做训练，通过分析训练数据得到每个属性对结果的影响的大小，这里我们通过一种叫做信息增益的理论去描述它，期间也涉及到熵的概念。也可参考文章信息增益与熵.下面我们结合实例说一下决阅读全文

posted @ 2014-04-02 15:12 Django's blog 阅读(628) 评论(0) 推荐(0)

决策树算法

摘要：决策树算法总结参考：《机器学习》Tom版以及http://blog.csdn.net/v_july_v/article/details/7577684一、简介决策树是一个预测模型；他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象，而每个分叉路径则代表的某个可能的属性值，而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出，若欲有复数输出，可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术，可以用于分析数据，同样也可以用来作预测（就像上面的银行官员用他来预测贷款风险）。从数据产生决策树的机器学习技术叫做决策树学习, 阅读全文

posted @ 2014-04-02 15:06 Django's blog 阅读(499) 评论(0) 推荐(0)

推荐系统相关算法(1)：SVD

摘要： http://www.cnblogs.com/FengYan/archive/2012/05/06/2480664.html1. SVD简介假如要预测Zero君对一部电影M的评分，而手上只有Zero君对若干部电影的评分和风炎君对若干部电影的评分（包含M的评分）。那么能预测出Zero君对M的评分吗？答案显然是能。最简单的方法就是直接将预测分定为平均分。不过这时的准确度就难说了。本文将介绍一种比这个最简单的方法要准上许多，并且也不算复杂的算法。 SVD(Singular Value Decomposition)的想法是根据已有的评分情况，分析出评分者对各个因子的喜好程度以及电影包含各个因子的程度，阅读全文

posted @ 2014-04-02 14:16 Django's blog 阅读(318) 评论(0) 推荐(0)

SVD在推荐系统中的应用

摘要： http://blog.csdn.net/wuyanyi/article/details/7964883参考自：http://www.igvita.com/2007/01/15/svd-recommendation-system-in-ruby/其实说参考也不准确，准确地说应该是半翻译半学习笔记。仔细整理一遍，感觉还是收获很大的。线性代数相关知识：任意一个M*N的矩阵A（M行*N列，M>N），可以被写成三个矩阵的乘机：1.U：（M行M列的列正交矩阵）2.S：（M*N的对角线矩阵，矩阵元素非负）3.V：（N*N的正交矩阵的倒置）即A=U*S*V‘（注意矩阵V需要倒置）直观地说：假设我们有一阅读全文

posted @ 2014-04-02 14:14 Django's blog 阅读(354) 评论(0) 推荐(0)

个性化推荐研究（四）之如何利用用户行为数据

摘要： http://my.oschina.net/wxcchd/blog/139271如何利用用户行为数据?目前应用最广泛的就是使用基于用户行为数据分析的算法进行推荐。基于用户行为数据分析的推荐算法一般被成为协同过滤算法。协同过滤算法有很多种，基于邻域的方法、隐语义模型、基于图的随机游走算法等等，而协同过滤也只是推荐算法中的一类，还有基于人口统计学的推荐、基于内容的推荐等等。实际应用中用到最多的还有机器学习，聚类分类等等貌似在实际中都有应用。由于对机器学习一点也不了解，这里也就不提了，以后会对其进行补充。本文主要整理的是基于邻域的方法，主要包含两种算法：基于用户的协同过滤(userCF)和基于物品的阅读全文

posted @ 2014-04-02 12:20 Django's blog 阅读(1019) 评论(0) 推荐(0)

推荐系统开源软件列表

摘要： http://www.tuicool.com/articles/6reU7f收集和整理了目前互联网上能找到的和推荐系统相关的开源项目(Open Source Software | Recommendation)，罗列如下，希望对本领域感兴趣的朋友有帮助（文/陈运文）SVDFeature由上海交大的同学开发（开发语言C++），代码严谨、质量高，我们参加KDD竞赛时用过，很可靠和方便，而且出自咱们国人之手，所以置顶推荐！项目地址：http://svdfeature.apexlab.org/wiki/Main_PageSVDFeature包含一个很灵活的Matrix Factorization推荐框阅读全文

posted @ 2014-04-02 12:19 Django's blog 阅读(1125) 评论(0) 推荐(0)

公告