2013年6月14日

MDB TOP250影片排名算法(转)

摘要: http://hi.baidu.com/relaxlp/blog/item/c2e3ae7e0a3727320dd7dad6.html 阅读全文

posted @ 2013-06-14 22:21 Paul_bai 阅读(301) 评论(0) 推荐(0) 编辑

2013年1月22日

理解javascript中的闭包

摘要: 转:http://www.jb51.net/article/24101.htm闭包(closure)是Javascript语言的一个难点,也是它的特色,很多高级应用都要依靠闭包实现。一、变量的作用域要理解闭包,首先必须理解Javascript特殊的变量作用域。变量的作用域无非就是两种:全局变量和局部变量。Javascript语言的特殊之处,就在于函数内部可以直接读取全局变量。 var n=999; function f1(){ alert(n); } f1(); // 999另一方面,在函数外部自然无法读取函数内的局部变量。 function f1(){ var n=99... 阅读全文

posted @ 2013-01-22 12:33 Paul_bai 阅读(178) 评论(0) 推荐(0) 编辑

2013年1月15日

jQuery中的filter和find函数

摘要: jQuery官方的API这样说明filter和find函数:filter(selector):Description: Reduce the set of matched elements to those that match the selector or pass the function’s test.find(selector):Description: Get the descendants of each element in the current set of matched elements, filtered by a selector.find()获得当前元素匹配集合中 阅读全文

posted @ 2013-01-15 15:50 Paul_bai 阅读(619) 评论(0) 推荐(0) 编辑

2013年1月5日

推荐系统中的SVD算法

摘要: 1. SVD简介假如要预测Zero君对一部电影M的评分,而手上只有Zero君对若干部电影的评分和风炎君对若干部电影的评分(包含M的评分)。那么能预测出Zero君对M的评分吗?答案显然是能。最简单的方法就是直接将预测分定为平均分。不过这时的准确度就难说了。本文将介绍一种比这个最简单的方法要准上许多,并且也不算复杂的算法。 SVD(Singular Value Decomposition)的想法是根据已有的评分情况,分析出评分者对各个因子的喜好程度以及电影包含各个因子的程度,最后再反过来根据分析结果预测评分。电影中的因子可以理解成这些东西:电影的搞笑程度,电影的爱情爱得死去活来的程度,电影的恐怖程 阅读全文

posted @ 2013-01-05 17:07 Paul_bai 阅读(779) 评论(0) 推荐(0) 编辑

强大的矩阵奇异值分解(SVD)及其应用

摘要: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言:上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释。特征值和奇异值在大部分人的印象中,往往是停留在纯粹的数学计算中。而且线性代数或者矩阵论里面,也很少讲任何跟特征值与奇异值有关的应用背景。奇异值分解是一个有着很明显的物理意义的一种方法,它可以将一个比较复杂的矩阵用更小更简单的几个子矩阵 阅读全文

posted @ 2013-01-05 16:50 Paul_bai 阅读(214) 评论(0) 推荐(0) 编辑

2012年11月16日

推荐系统算法总结(转)

摘要: 转:http://somemory.com/myblog/?post=12最近看推荐系统方面的东西也有段日子了,有书,博客,唯独没有看论文。总感觉论文对于工业界来说用处真的不如学校做课题、论文那么大,只要知道某个算法好不好用以及怎么用就可以了,也不必知道太多的细节和数学推导。但根据一个好的算法,产品部门可以设计出很多很酷的产品,让用户倍感web应用的人性化。在看书,看大牛们的博客时,学习到了很多算法和思路。现在总结一下:1、Item based collective filtering这个算法是cf中的一种,也是当今很多大型网站都在采用的核心算法之一。对于商城网站(以Amazon为代表,当然也 阅读全文

posted @ 2012-11-16 21:26 Paul_bai 阅读(382) 评论(0) 推荐(0) 编辑

围脖局部影响力计算example(转)

摘要: 转自:http://somemory.com/myblog/?post=48最近看了一篇SIGIR 09年的paper,介绍的是如何区分一个用户是expert还是spammer,其实也就是对用户的expertise进行排名。文中讲到的算法spear,是基于HITS(Hypertext Induced Topic Search)算法改进的,是SPamming-resistant Expertise Analysis and Ranking的缩写。文中的实验数据是用delicious的数据。算法中做了两个基本的假设是(1)Mutual reinforcement of user expertise 阅读全文

posted @ 2012-11-16 21:19 Paul_bai 阅读(268) 评论(0) 推荐(0) 编辑

推荐系统方面的论文(Yahoo Research)

摘要: Netflix Prize的冠军队成员Yahoo Research的大神的论文1、《Matrix Factorization Techniques For Recommender Systems》2、《Factorization Meets the Neighborhood:a Multifaceted Collaborative Filtering Model》3、《Adaptive Bootstrapping of Recommender Systems Using Decision Trees》4、《Yahho!Music Recommendations:Modeling Music R 阅读全文

posted @ 2012-11-16 21:11 Paul_bai 阅读(1509) 评论(0) 推荐(0) 编辑

2012年10月10日

【算法题】找出一个整型数组里两个不同数字

摘要: 题目:一个整型数组里除了两个数字之外,其他的数字都出现了两次。请写程序找出这两个只出现一次的数字。要求时间复杂度是O(n),空间复杂度是O(1)。分析:这是一道很新颖的关于位运算的面试题。首先我们考虑这个问题的一个简单版本:一个数组里除了一个数字之外,其他的数字都出现了两次。请写程序找出这个只出现一次的数字。这个题目的突破口在哪里?题目为什么要强调有一个数字出现一次,其他的出现两次?我们想到了异或运算的性质:任何一个数字异或它自己都等于0。也就是说,如果我们从头到尾依次异或数组中的每一个数字,那么最终的结果刚好是那个只出现依次的数字,因为那些出现两次的数字全部在异或中抵消掉了。有了上面简单问题 阅读全文

posted @ 2012-10-10 21:11 Paul_bai 阅读(737) 评论(0) 推荐(0) 编辑

【算法题】求最大子数组之和

摘要: 题目:输入一个整形数组,数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组,每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4, 7, 2, -5,和最大的子数组为3, 10, -4, 7, 2,因此输出为该子数组的和18。分析:本题最初为2005年浙江大学计算机系的考研题的最后一道程序设计题,在2006年里包括google在内的很多知名公司都把本题当作面试题。由于本题在网络中广为流传,本题也顺利成为2006年程序员面试题中经典中的经典。如果不考虑时间复杂度,我们可以枚举出所有子数组并求出他们的和。不过非常遗憾 阅读全文

posted @ 2012-10-10 20:19 Paul_bai 阅读(353) 评论(0) 推荐(0) 编辑

导航