Lei's Blog

关注机器学习、信息检索、数据挖掘和推荐系统等研究领域

  :: 首页 :: 博问 :: 闪存 :: 新随笔 :: :: 订阅 订阅 :: 管理 ::
上一页 1 ··· 7 8 9 10 11 12 13 下一页

2012年9月16日

摘要: 问题定义:我们知道,现在电子商务网站不但为用户提供各种商品,而且还允许用户建立他们的社区关系,例如用户可以加别的用户为朋友,也可以加入一个自己感兴趣的社区。那么在这样一个社区网站,用户可能不仅仅是对商品推荐感兴趣,他们可能还希望系统能自动给他们推荐朋友,或者兴趣小组。本文提出了一种基于随机概率模型(GSBM),该模型同时对用户的社会关系和评分行为建模,因此该模型可以同时预测用户的朋友关系和评分行为,从而为用户提供朋友推荐和商品推荐。方法:首先,本文的方法假设用户都属于K1个兴趣小组,商品属于K2个类别。对于用户来说,他们有一定的概率属于某个兴趣小组,而对于商品来说,他们有一定的概率属于某个类别 阅读全文
posted @ 2012-09-16 09:55 Lei-Blog 阅读(854) 评论(1) 推荐(0) 编辑

2012年9月6日

摘要: 矩阵分解方法由于在Netflix中取的好成绩,成为近年来推荐系统中比较流行的推荐方法(无论是隐示数据还是显示数据,用的人都很多)。早期的方法有SVD,它通对评分矩阵进行分解,学习到潜在特征向量,但是它很容易过学习,因此,又提出了带正则化项目的分解方法。除此之外,还有基于概率论的推荐模型(Hofmann,probabilistic latent semantic model),以及基于分类问题的推荐方法,基于排序的模型等。本文我们将介绍一种在隐数据集上以个性化排序(每个用户都有不同的排序)为目标的推荐方法。这里的隐数据可以购买行为,点击行为或是观看行为。问题的形式化假设可观测的数据用S表示U表示 阅读全文
posted @ 2012-09-06 21:55 Lei-Blog 阅读(614) 评论(0) 推荐(0) 编辑

摘要: rocketmail.comIncoming (pop3) - plus.pop.mail.yahoo.com 110Outgoing (smtp) - smtp.mail.yahoo.com 25竟然可以了,以后不行了再想办法y7mail.com默认设置即可,要选择使用SSL并且保证pop选项开启 阅读全文
posted @ 2012-09-06 14:15 Lei-Blog 阅读(221) 评论(0) 推荐(0) 编辑

2012年9月5日

摘要: 在本篇文章中,我们讨论一下利用线性模型进行分类的有关问题。与回归问题不同,分类问题的输出不是一个连续的值,而是一个离散的量(k=1....K),在大多数场景中,classes之间通常是互斥的(disjiont),也就是说每一个输入只能属于一个类别,也就有了决策边界、决策面之说。在本文中,如果数据集的类别可以被线性决策面精确分开,那么该数据集就是线性可分的。在概率论模型中,如何是两类问题,我们可以用t=0,t=1去表示不同的类别。对于K>2时,我们用向量t=(0,1,0,0,0)T来表示,它表示5个类别中的第2类,用tk的值表示它属于类Ck的概率,使用p(x,t)对这种不确定性进行建模,从 阅读全文
posted @ 2012-09-05 22:37 Lei-Blog 阅读(302) 评论(0) 推荐(0) 编辑

摘要: 当利用多项式对二次曲线进行拟合的时候,我们会发现如果多项式的次数比较高,为了和训练数据一致,系数会出现很多非常大和非常小的数,并且多项式函数的曲线出现很大的波动。直观上讲,M(order)的值越大,越容易受随机噪声的影响。但是,这种过似合现象会随着数据的增多而逐渐减轻,也就是说,数据量越大,越应该使用较为复杂的模型去拟合。有一种经验的说法是说,样式本的数量至少要多于所要学习的参数的5到10倍,但是有研究表明,参数的数量并不与模型的复杂度成比例,并且我们也不能根据参数的个数来选择模型的复杂度,而是应该根据问题本身。对于过学习问题,判别模型使用正则化方法来解决(i.e., ||w||2=w20+w 阅读全文
posted @ 2012-09-05 21:40 Lei-Blog 阅读(846) 评论(0) 推荐(0) 编辑

2012年9月1日

摘要: 版本作者联系日期1.0周巍然weiran.chow@gmail.com201207232.0严程supersteven198701@gmail.com201208213.0严程supersteven198701@gmail.com20120831摘要: 本文以2011年举办的第一届数据挖掘邀请赛的"世纪佳缘会员推荐"赛题为例,尝试了5种排序方法来为新注册会员推荐容易受到亲睐的老会员。 先看5种排序方法的测试结果,以便朋友们有针对性地浏览本文。基于5倍交叉验证NKCG@10基于training set验证NKCG@10随机模型0.08659561709415893基于投票加权 阅读全文
posted @ 2012-09-01 17:01 Lei-Blog 阅读(475) 评论(0) 推荐(0) 编辑

摘要: 首先是给出costFunction, 然后设置参数的优化选项,以及参数的初始值,最后是调用fminunc函数代码如下:function [jVal, gradient]=costFunction(theta) jVal=(theta(1)-5)^2+(theta(2)-5)^2; gradient=zeros(2,1); gradient(1)=2*(theta(1)-5); gradient(2)=2*(theta(2)-5);endoptions=optimset('GradObj','on','MaxIter',100);initi... 阅读全文
posted @ 2012-09-01 10:44 Lei-Blog 阅读(9979) 评论(0) 推荐(0) 编辑

摘要: 阅读全文
posted @ 2012-09-01 09:06 Lei-Blog 阅读(126) 评论(0) 推荐(0) 编辑

2012年8月26日

摘要: 初次跟acm@sheridanprinting.com出版社打交道,虽然很多东西都是按他们的要求来的,但还会忽略掉一些问题,不得不重新修改,我自己遇到的问题如下:1. 页面的大小,需要在输出pdf时将A4转化为letter类型,其大小为(8.5x11 inches),具体办法见http://www.cnblogs.com/guolei/archive/2012/08/25/2545864.html2. 标题不能出现在每一栏的底部3. 要求pdf中必尖嵌入如有type1类型的字体,具体办法见http://www.cnblogs.com/guolei/archive/2012/08/25/2656 阅读全文
posted @ 2012-08-26 19:10 Lei-Blog 阅读(1009) 评论(0) 推荐(0) 编辑

2012年8月25日

摘要: 作者:Jiaping Gui 桂佳平 (Intel)(5 篇文章) 日期: 九月 3, 2011 在 4:19 下午最近笔者在投递相关文章时,投稿系统显示未嵌入Helvetica和TimesNewRomanPS系列字体,在网上也找了一些解决方案,比如:pdf文件里怎么嵌入中文字体?eps图片中的helvetica字体始终不能嵌入?LaTeX生成嵌入所有字体的Pdf文件(Windows+MiKTeX)等等。这些文章中的解决方案有些需要重新下载专用的字体子集库,有些需要繁琐的配置文件或输入复杂的命令格式,耗时耗力且不一定可行。我尝试了另一种新的快速易行的解决方法,非常成功,现分享给大家:我使用了C 阅读全文
posted @ 2012-08-25 22:34 Lei-Blog 阅读(2737) 评论(0) 推荐(0) 编辑

上一页 1 ··· 7 8 9 10 11 12 13 下一页