摘要:
今天查文献的时候看到ACM RecSys 2010的一篇关于top-n推荐的文章,注意到文章的第二作者是Netflix Prize赛程中贡献最大的Yehuda Koren,所以仔细读了一下。看完之后相当困惑:高手也有盲点?Yehuda Koren是Netflix Prize获奖团队的主要成员,在整个赛事中展现出了非常优秀的问题分析和数据分析能力。但这篇文章的话题却实在让人意外。文章的作者通过实验发现,在Netflix Prize中表现优异的算法虽然可以大幅降低RMSE,但如果以Recall@n或者Precision@n作为评测标准,效果却非常差,还不如直接推荐最热门的商品效果好。很诧异作者会因 阅读全文
摘要:
MAP(Mean Average Precision):单个主题的平均准确率是每篇相关文档检索出后的准确率的平均值。主集合的平均准确率(MAP)是每个主题的平均准确率的平均值。MAP 是反映系统在全部相关文档上性能的单值指标。系统检索出来的相关文档越靠前(rank 越高),MAP就可能越高。如果系统没有返回相关文档,则准确率默认为0。例如:假设有两个主题,主题1有4个相关网页,主题2有5个相关网页。某系统对于主题1检索出4个相关网页,其rank分别为1, 2, 4, 7;对于主题2检索出3个相关网页,其rank分别为1,3,5。对于主题1,平均准确率为(1/1+2/2+3/4+4/7)/4=0 阅读全文
摘要:
个人理解:如果函数解不出导数得0的解析解,则采用梯度下降法这种数值算法,使用该方法求出近似解 阅读全文
摘要:
下面是一些开源的推荐系统的包,希望对大家有用。1、http://lenskit.grouplens.org/2、http://easyrec.org/3、http://savannah.nongnu.org/4、http://glaros.dtc.umn.edu/gkhome/software5、http://mahout.apache.org/6、http://www.ismll.uni-hildesheim.de/mymedialite/7、用php实现的slopeone算法,http://code.google.com/p/openslopeone/8、用php实现的推荐器,http:/ 阅读全文
摘要:
目前我一共找到两个版本:1.总大小Probabilistic Graphical Models Principles and Techniques_I.pdf Probabilistic Graphical Models Principles and Techniques_II.pdf2.总大小 19.24 阅读全文
摘要:
运行以下命令即可。。如果提示已存在,选择Y覆盖就行了。。可以用快捷键:键盘左下角的“Windows四格键+R”reg add HKCU\Software\Microsoft\Office\14.0\Word\Options /v NoReReg /t REG_DWORD /d 1 阅读全文
摘要:
Aurora是一款可以在Office中插入LaTeX公式的小软件。众所周知的是LaTeX输入公式的方式和显示效果都要比Office自带的公式编辑器好很多,而且也比MathType强,相关文章《可以在Word中插入LaTeX公式的软件——Aurora》。注册机使用方法:首先安装Aurora 2.x,然后下载注册机并运行,在文本框中随便输入点什么东西都行,然后点Register即可完成注册。然后再运行Aurora应该就不会再有需要注册的提示了。需要注意的是输入的东西不要太长,而且不要输入中文,因为Aurora是基于Unicode的,而这个注册机不是Unicode的,所以输入中文会有问题。下载地址h 阅读全文
摘要:
最近在写毕业论文了,参考文献要60篇,着实让人郁闷啊!!!!格式应符合GB/T7714-2005《文后参考文献著录规则》。文献是期刊时,其格式为:(序号),作者(外文姓列名前).文献题名.期刊名(外文可缩写):年份.卷(期):页码.获取和访问路径.这样的格式如果用手敲进去着实让人郁闷啊~下午敲了10篇之后彻底失去耐心也~灵机一动想起来研一学的信息检索这门课,好课啊~好课~1. 打开万方数据的主页,在左上角的第一行有个更多地选项卡,里面有个查新/垮库检索,这个玩意是个好东西啊~但是从来都没有用过!点之~就要爽了~2. 接着会进入下面这个页面,在搜索窗口中输入你要检索的东西,这里我整了个“机顶盒” 阅读全文
摘要:
KDD 2012 的会议论文精彩纷呈,涵盖了数据挖掘领域的各个方面,反映了数据挖掘领域的最新进展。 社会网络和社会媒体这次大会论文的一个热点。有关研究涉及到 PageRank 和社会网络分析,社会媒体中的意见分析,社会与 web 挖掘应用,社团挖掘,评价(review)、讨论和问答,团队、趋势和社会建档(profiling)等。 推荐系统和广告是另一个热点,包括个性化与推荐,广告与视频推荐,推荐方法等。 在数据挖掘的核心方向上,一批最新的成果涌现出来,如模式挖掘,时间序列挖掘,事件挖掘,序列和时空模式挖掘,奇异点(outlier)和入侵挖掘,特征提取,最近邻方法,图挖掘,聚类方法等。 阅读全文