2013年10月5日

推荐系统入门实践:世纪佳缘会员推荐(完整版)

摘要: http://www.cnblogs.com/supersteven/archive/2012/09/01/2666565.html版本作者联系日期1.0周巍然weiran.chow@gmail.com201207232.0严程supersteven198701@gmail.com201208213.0严程supersteven198701@gmail.com20120831摘要: 本文以2011年举办的第一届数据挖掘邀请赛的"世纪佳缘会员推荐"赛题为例,尝试了5种排序方法来为新注册会员推荐容易受到亲睐的老会员。 先看5种排序方法的测试结果,以便朋友们有针对性地浏览本文。基 阅读全文

posted @ 2013-10-05 22:22 berkeleysong 阅读(477) 评论(0) 推荐(0) 编辑

[收藏]统计中的置信和惩罚

摘要: http://www.zhizhihu.com/html/y2013/4151.html如何对样本数目加惩罚来保证置信,样本数目很少的时候,统计结果往往不置信。看了阮一峰老师的博客和《How Not To Sort By Average Rating》,还有论文《How to Count Thumb-Ups and Thumb-Downs》,还有wiki上的各种置信区间《confidence interval》,了解了一些方法,例如:一、威尔逊置信区间(Score = Lower bound of Wilson score confidence interval for a Bernoulli 阅读全文

posted @ 2013-10-05 22:09 berkeleysong 阅读(1653) 评论(0) 推荐(0) 编辑

导航