Lei-Blog - 博客园

[转]个性化推荐引擎：社会评分网络中的推荐问题

摘要：问题定义：我们知道，现在电子商务网站不但为用户提供各种商品，而且还允许用户建立他们的社区关系，例如用户可以加别的用户为朋友，也可以加入一个自己感兴趣的社区。那么在这样一个社区网站，用户可能不仅仅是对商品推荐感兴趣，他们可能还希望系统能自动给他们推荐朋友，或者兴趣小组。本文提出了一种基于随机概率模型(GSBM)，该模型同时对用户的社会关系和评分行为建模，因此该模型可以同时预测用户的朋友关系和评分行为，从而为用户提供朋友推荐和商品推荐。方法：首先，本文的方法假设用户都属于K1个兴趣小组，商品属于K2个类别。对于用户来说，他们有一定的概率属于某个兴趣小组，而对于商品来说，他们有一定的概率属于某个类别阅读全文

posted @ 2012-09-16 09:55 Lei-Blog 阅读(858) 评论(1) 推荐(0) 编辑

Personalized Ranking from Implicit Feedback

摘要：矩阵分解方法由于在Netflix中取的好成绩，成为近年来推荐系统中比较流行的推荐方法（无论是隐示数据还是显示数据，用的人都很多）。早期的方法有SVD，它通对评分矩阵进行分解，学习到潜在特征向量，但是它很容易过学习，因此，又提出了带正则化项目的分解方法。除此之外，还有基于概率论的推荐模型（Hofmann,probabilistic latent semantic model）,以及基于分类问题的推荐方法，基于排序的模型等。本文我们将介绍一种在隐数据集上以个性化排序（每个用户都有不同的排序）为目标的推荐方法。这里的隐数据可以购买行为，点击行为或是观看行为。问题的形式化假设可观测的数据用S表示U表示阅读全文

posted @ 2012-09-06 21:55 Lei-Blog 阅读(620) 评论(0) 推荐(0) 编辑

用fixfox收取yahoo.com邮件

摘要： rocketmail.comIncoming (pop3) - plus.pop.mail.yahoo.com 110Outgoing (smtp) - smtp.mail.yahoo.com 25竟然可以了，以后不行了再想办法y7mail.com默认设置即可，要选择使用SSL并且保证pop选项开启阅读全文

posted @ 2012-09-06 14:15 Lei-Blog 阅读(225) 评论(0) 推荐(0) 编辑

线性模型与决策理论

摘要：在本篇文章中，我们讨论一下利用线性模型进行分类的有关问题。与回归问题不同，分类问题的输出不是一个连续的值，而是一个离散的量（k=1....K），在大多数场景中，classes之间通常是互斥的(disjiont)，也就是说每一个输入只能属于一个类别，也就有了决策边界、决策面之说。在本文中，如果数据集的类别可以被线性决策面精确分开，那么该数据集就是线性可分的。在概率论模型中，如何是两类问题，我们可以用t=0，t=1去表示不同的类别。对于K>2时，我们用向量t=(0,1,0,0,0)T来表示，它表示5个类别中的第2类，用tk的值表示它属于类Ck的概率，使用p(x,t)对这种不确定性进行建模，从阅读全文

posted @ 2012-09-05 22:37 Lei-Blog 阅读(306) 评论(0) 推荐(0) 编辑

曲线拟合问题

摘要：当利用多项式对二次曲线进行拟合的时候，我们会发现如果多项式的次数比较高，为了和训练数据一致，系数会出现很多非常大和非常小的数，并且多项式函数的曲线出现很大的波动。直观上讲，M(order)的值越大，越容易受随机噪声的影响。但是，这种过似合现象会随着数据的增多而逐渐减轻，也就是说，数据量越大，越应该使用较为复杂的模型去拟合。有一种经验的说法是说，样式本的数量至少要多于所要学习的参数的5到10倍，但是有研究表明，参数的数量并不与模型的复杂度成比例，并且我们也不能根据参数的个数来选择模型的复杂度，而是应该根据问题本身。对于过学习问题，判别模型使用正则化方法来解决（i.e., ||w||2=w20+w 阅读全文

posted @ 2012-09-05 21:40 Lei-Blog 阅读(853) 评论(0) 推荐(0) 编辑

【转】推荐系统入门实践：世纪佳缘会员推荐

摘要：版本作者联系日期1.0周巍然weiran.chow@gmail.com201207232.0严程supersteven198701@gmail.com201208213.0严程supersteven198701@gmail.com20120831摘要：本文以2011年举办的第一届数据挖掘邀请赛的"世纪佳缘会员推荐"赛题为例，尝试了5种排序方法来为新注册会员推荐容易受到亲睐的老会员。先看5种排序方法的测试结果，以便朋友们有针对性地浏览本文。基于5倍交叉验证NKCG@10基于training set验证NKCG@10随机模型0.08659561709415893基于投票加权阅读全文

posted @ 2012-09-01 17:01 Lei-Blog 阅读(480) 评论(0) 推荐(0) 编辑

matlab中如何使用fminunc进行优化

摘要：首先是给出costFunction, 然后设置参数的优化选项，以及参数的初始值，最后是调用fminunc函数代码如下：function [jVal, gradient]=costFunction(theta) jVal=(theta(1)-5)^2+(theta(2)-5)^2; gradient=zeros(2,1); gradient(1)=2*(theta(1)-5); gradient(2)=2*(theta(2)-5);endoptions=optimset('GradObj','on','MaxIter',100);initi... 阅读全文

posted @ 2012-09-01 10:44 Lei-Blog 阅读(9990) 评论(0) 推荐(0) 编辑

一组照片

摘要：

阅读全文

posted @ 2012-09-01 09:06 Lei-Blog 阅读(127) 评论(0) 推荐(0) 编辑

ACM论文格式上常见的一些错误

摘要：初次跟acm@sheridanprinting.com出版社打交道，虽然很多东西都是按他们的要求来的，但还会忽略掉一些问题，不得不重新修改，我自己遇到的问题如下：1. 页面的大小，需要在输出pdf时将A4转化为letter类型，其大小为（8.5x11 inches），具体办法见http://www.cnblogs.com/guolei/archive/2012/08/25/2545864.html2. 标题不能出现在每一栏的底部3. 要求pdf中必尖嵌入如有type1类型的字体，具体办法见http://www.cnblogs.com/guolei/archive/2012/08/25/2656 阅读全文

posted @ 2012-08-26 19:10 Lei-Blog 阅读(1017) 评论(0) 推荐(0) 编辑

【转】PDF文件【由Latex、CTex或MS Word等生成】嵌入所有字体的快速解决方法

摘要：作者：Jiaping Gui 桂佳平 (Intel)(5 篇文章) 日期：九月 3, 2011 在 4:19 下午最近笔者在投递相关文章时，投稿系统显示未嵌入Helvetica和TimesNewRomanPS系列字体，在网上也找了一些解决方案，比如：pdf文件里怎么嵌入中文字体？eps图片中的helvetica字体始终不能嵌入？LaTeX生成嵌入所有字体的Pdf文件（Windows+MiKTeX）等等。这些文章中的解决方案有些需要重新下载专用的字体子集库，有些需要繁琐的配置文件或输入复杂的命令格式，耗时耗力且不一定可行。我尝试了另一种新的快速易行的解决方法，非常成功，现分享给大家：我使用了C 阅读全文

posted @ 2012-08-25 22:34 Lei-Blog 阅读(2748) 评论(0) 推荐(0) 编辑

Lei's Blog

公告