摘要:
L1 and L2 regularization add a cost to high valued weights to prevent overfitting. L1 regularization is an absolute value cost function and tends to s... 阅读全文
摘要:
1. 随机森林使用背景1.1 随机森林定义随机森林是一种比较新的机器学习模型。经典的机器学习模型是神经网络,有半个多世纪的历史了。神经网络预测精确,但是计算量很大。上世纪八十年代 Breiman等人发明分类树的算法(Breiman et al. 1984),通过反复二分数据进行分类或回归,计算量大大... 阅读全文
摘要:
http://cos.name/2013/01/lda-math-gamma-function/ 阅读全文
摘要:
http://blog.csdn.net/xianlingmao/article/details/7340099《理解共轭先验》如果你读过贝叶斯学习方面的书或者论文,想必是知道共轭先验这个名词的。现在假设你闭上眼睛,你能准确地说出共轭分布是指哪个分布和哪个分布式共轭的吗?我之前就常常把这个关系弄错,... 阅读全文
摘要:
HITS(HITS(Hyperlink - Induced Topic Search) ) 算法是由康奈尔大学( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,为IBM 公司阿尔马登研究中心( IBM Almaden Research Cent... 阅读全文
摘要:
转自:http://www.letiantian.me/2014-10-12-three-models-of-naive-nayes/朴素贝叶斯是一个很不错的分类器,在使用朴素贝叶斯分类器划分邮件有关于朴素贝叶斯的简单介绍。若一个样本有n个特征,分别用[latex]x_{1},x_{2},...,x... 阅读全文
摘要:
转自:http://blog.163.com/jiayouweijiewj@126/blog/static/1712321772010102802635243/琢 磨了两天,对于朴素贝叶斯的原理弄得很清楚,可是要做文本分类,看了好多文章知道基于朴素贝叶斯公式,比较出后验概率的最大值来进行分类,后验概... 阅读全文
摘要:
转自http://blog.csdn.net/lch614730/article/details/17031145朴素贝叶斯分类算法(Naive Bayesian classification)PS:本文在讲解的时候会用通俗的例子来讲解本文我们将学习到:(1)什么是朴素贝叶斯?(2)先验概率和条件概... 阅读全文
摘要:
简介更一般性的问题会问:“点数1~6的出现次数分别为(x1,x2,x3,x4,x5,x6)时的概率是多少?其中sum(x1~x6)= n”。这就是一个多项式分布。定义把二项分布推广至多个(大于2)互斥事件的发生次数,就得到了多项分布。二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币... 阅读全文
摘要:
转自:http://xuehy.github.io/%E4%BC%98%E5%8C%96/2014/04/13/KKT/从对偶问题到KKT条件Apr 13, 2014对偶问题(Duality)======对偶性是优化问题中一个非常重要的性质,它能够神奇地将许多非凸的优化问题转化成凸的问题,关于这一理... 阅读全文