09 2014 档案
摘要:(原创文章,转载请注明出处!)推荐系统关注的是人与物品,希望预测出人对物品的喜欢程度。不同的人有相近的喜好(比如:都喜欢武侠小说),不同的物品有相近的特征(比如:都是武侠小说)。当想预测一个用户A对其还没有评价的的物品T的评分时,可以从两个角度来考虑:找和用户A有相近喜欢的人,通过他们对物品T的评分...
阅读全文
摘要:(原创文章,转载请注明出处!)一、问题实现对电影的推荐,数据集中有约1600部电影,有约900个用户对这些电影进行了评价。设每个电影有10个特征,根据推荐系统(一)描述的算法,每个用户也相应的有10的参数,那么总的参数个数 ≈ 1600 * 10 + 900 * 10 ≈ 16000 + 9000 ...
阅读全文
摘要:(原创文章,转载请注明出处!)本篇来解决一个异常检测问题。样本数据约300个,无标签的二维数据。此外,还有一个有标签的验证数据集,包含约300个样本。一、将每个维度数据的直方图plot出来1 hist(X[,1], breaks=seq(from=floor(min(X[,1])),to=ceili...
阅读全文
摘要:(原创文章,转载请注明出处!)在文章应用高斯分布来解决异常检测问题(一)中对如何使用高斯分布来解决异常检测问题进行了描述,本篇是使用R编程实现了第一篇中所描述的两个模型:多个一元高斯分布模型和一个多元高斯分布模型。一、 多个一元高斯分布模型 1 ## parameters: 2 ## xNe...
阅读全文
摘要:(原创文章,转载请注明出处!)异常检测的样本数据,可能有标签,但通常正常状况的样本很多,异常状况的样本很少,并且出异常的原因通常也不尽相同。所以,可以只针对正常状况的样本建模。而如果收集到一堆的数据没有标签,则可以对所有的样本数据用一个模型建模,因为通常数据中异常状况的样本很少,对最终模型的影响很小...
阅读全文
摘要:(原创文章,转载请注明出处!)高斯分布的密度函数一元高斯分布:p(x;μ,σ2)=(1/{sqrt(2π)*σ}) * exp{-(x-μ)2/(2σ2)}期望:E(X) = μ;方差:D(X) = σ2二元高斯分布:p(x1,x2;μ1,μ2,σ12,σ22)={ 1 / [2π*σ1σ2*sqr...
阅读全文