摘要:
K-means算法很简单,它属于无监督学习算法中的聚类算法中的一种方法吧,利用欧式距离进行聚合啦。 解决的问题如图所示哈:有一堆没有标签的训练样本,并且它们可以潜在地分为K类,我们怎么把它们划分呢? 那我们就用K-means算法进行划分吧。 算法很简单,这么做就可以啦: 第一步:随机初始化每种类别的中心点,u1,u2,u3,……,uk; 第二步:重复以下过程: 然后 ,就没有然后了... 阅读全文
摘要:
对于高斯混合模型是干什么的呢?它解决什么样的问题呢?它常用在非监督学习中,意思就是我们的训练样本集合只有数据,没有标签。 它用来解决这样的问题:我们有一堆的训练样本,这些样本可以一共分为K类,用z(i)表示。,但是具体样本属于哪类我们并不知道,现在我们需要建立一个模型来描述这个训练样本的分布。这时, 我们就可以用高斯混合模型来进行描述。 怎么入手呢? 高斯混合模型: 我们这么想,因为样本集合潜... 阅读全文
摘要:
对于常见的分类算法,经常用到的都是判别学习算法,如 logistic二元分类器,还有softmax分类器等。它们都有一个共同的特点,那就是我们直接去求 p(y|x; θ), 有时候也表示为 hθ(x),这类方法的重点是去拟合参数θ。 还有一种算法:生成学习算法。它的中心思想是直接去求p(y|x; θ 阅读全文
摘要:
首先说明啊:logistic分类器是以Bernoulli(伯努利) 分布为模型建模的,它可以用来分两种类别;而softmax分类器以多项式分布(Multinomial Distribution)为模型建模的,它可以分多种互斥的类别。 补充: 什么是伯努利分布?伯努利分布[2] 是一种离散分布,有两种 阅读全文