摘要: 稍微了解有监督机器学习的人都会知道,我们先通过训练集训练出模型,然后在测试集上测试模型效果,最后在未知的数据集上部署算法。然而,我们的目标是希望算法在未知的数据集上有很好的分类效果(即最低的泛化误差),为什么训练误差最小的模型对控制泛化误差也会有效呢?这一节关于学习理论的知识就是让大家知其然也知其所 阅读全文
posted @ 2015-04-05 17:54 Logos 阅读(114) 评论(0) 推荐(0) 编辑
摘要: SVM被许多人认为是有监督学习中最好的算法,去年的这个时候我就在尝试学习。不过,面对长长的公式和拗口的中文翻译最终放弃了。时隔一年,看到Andrew讲解SVM,总算对它有了较为完整的认识,总体思路是这样的:1.介绍间隔的概念并重新定义符号;2.分别介绍functional margins与geome 阅读全文
posted @ 2015-03-26 20:45 Logos 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 距离上一篇笔记竟然快要一个月了……希望这周能把cs229监督学习部分的知识搞定。 生成学习与判别学习 像逻辑回归,用hθ(x) = g(θTx) 直接地来建模 p(y|x; θ) ;或者像感知机,直接从输入空间映射到输出空间(0或1),它们都被称作判别学习(discriminative learni 阅读全文
posted @ 2015-03-23 17:39 Logos 阅读(232) 评论(0) 推荐(0) 编辑
摘要: 为了给课程的前四讲画上一个句号,这里补充两个前四讲中NG大神提到过的模型。 The perceptron learning algorithm 感知机 模型: 从模型上来看感知机与逻辑回归十分相似,只不过逻辑回归的g函数是逻辑函数(又称sigmoid函数),它是一条从y值0到1的连续曲线。当z→∞, 阅读全文
posted @ 2015-02-26 21:56 Logos 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 一直听闻Logistic Regression逻辑回归的大名,比如吴军博士在《数学之美》中提到,Google是利用逻辑回归预测搜索广告的点击率。因为自己一直对个性化广告感兴趣,于是疯狂google过逻辑回归的资料,但没有一个网页资料能很好地讲清到底逻辑回归是什么。幸好,在CS229第三节课介绍了逻辑 阅读全文
posted @ 2015-02-26 00:28 Logos 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 应该是去年的这个时候,我开始接触机器学习的相关知识,当时的入门书籍是《数据挖掘导论》。囫囵吞枣般看完了各个知名的分类器:决策树、朴素贝叶斯、SVM、神经网络、随机森林等等;另外较为认真地复习了统计学,学习了线性回归,也得以通过orange、spss、R做一些分类预测工作。可是对外说自己是搞机器学习的 阅读全文
posted @ 2015-02-25 00:00 Logos 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 2013,给自己的评分是不及格;2014,总算是步入正轨。 1月,感谢老严 向老大提了不想做产品而想专心做数据的想法,非常幸运地被批准了。真的非常非常感谢老严,从此我得以开始拼命地学习。当然,一开始的时候是十分盲目的,比如这个月我从关联分析和聚类算法切入,开始研究数据挖掘。同时学习了一款叫orang 阅读全文
posted @ 2015-01-05 01:28 Logos 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 很幸运,我有一个开明的老大,跨年那天的抱怨文章转给他看之后便得到了尝试做纯数据工作的机会。 截止今天,看完了2本自认为很有用的入门读物《数据挖掘导论》与《统计学》,学习了两个软件orange与spss,完成了三篇对公司业务情况的专题研究(游戏用户聚类;游戏大户预测;电商优惠信息发布策略),对了,年后 阅读全文
posted @ 2014-04-13 18:34 Logos 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 2013,给自己的评分是不及格。 7月,好像玩得比工作多 入职第一周各种叙旧(3月份实习过一个多月),各种找状态,七月很快就结束了。这时我也大概得知了在公司的两个主要工作:数据分析平台DACE与比赛中心。 8月和DACE的“亲密”接触 DACE和比赛中心都算是大项目,不过DACE是探索性的数据产品且 阅读全文
posted @ 2013-12-29 17:13 Logos 阅读(28) 评论(0) 推荐(0) 编辑
摘要: 正式工作快要两个月了,博客也几乎停了两个月。之前计划的NBA数据挖掘系列与帝国时代编年史系列看起来一时半会是难以继续了。原因很简单:连周末都在填平时工作的坑,难得有空的时候宁愿看几集《银魂》。 既然说到银魂,那就以此说说最近感触最深的几点吧: 1.真羡慕空知猩猩啊(银魂的作者)。抱着随时可能被《JU 阅读全文
posted @ 2013-09-08 21:42 Logos 阅读(35) 评论(0) 推荐(0) 编辑