2.2 Multinomial variables多项变量的分布

    考虑多项变量即K个互斥变量(可能取值),使用1-of-K方式表示为K维向量x,其中某个向量xk=1,且其他向量=0。例如某个变量发生,对应向量为x3,则x3=1 :

        

    xk=1发生的概率为μk,那么x的分布为:

        

    这里,且,该分布可以看作是Bernoulli分布多输出的普遍形式,很明显上式是归一化的normalized:

        

        

    考虑N个独立观测值 {x1,…,xN} 数据集D, 对应的似然函数:

        

    其中:

        

    代表xk=1在D中发生次数。这是都是该分布的完全统计sufficient statistics。

    2.29的限制条件是,那么可以使用拉格朗日乘子法对lnp(D|μ),转换为最大化下式:

        

    基于μk求导等于0,得到:

            

    将该式代入,有 λ=-N,由此我们得到μ的最大似然解:

            

Multinomial distribution多项分布    

接下来我们考虑m1,m2,…,mK的联合分布,从2.29式,我们可以得到:

    

这就是多项分布归一化系数:

        

变量mk 受限于:

        

2.21 The Dirichlet distribution

    引入2.34式的先验的相似分布,共轭先验的形式应该是:

                

    这里,,对于3维来说,由于受限于总和,自由变量只有二维,所以k维变量就被限制在k-1维空间。如下图,取值限于一个平面,可以将这个平面投影到二维平面:

    

    

α1,…, αK 是分布的参数,α=(α1,…, αK)T,2.37式的归一化形式:

        

    其中:

            

    该分布就是Dirichlet distribution,该分布是连续多变量分布,是多变量普遍化的Beta分布。狄利克雷分布奠定了狄利克雷过程的基础,被广泛应用于自然语言处理特别是主题模型(topic model)的研究。下图是一个3变量分布:

    将先验2.38与相似函数2.34相乘,有:

        

    看得出,后验同样是一个Dirichlet分布,归一化系数,得到后验:

        

posted @ 2014-02-18 10:22 嗯Jeffrey 阅读(846) 评论(0) 推荐(0) 编辑
摘要: Bernouli 分布 单变量x ∈{0, 1} ,x的概率由参数 μ,表示: 统一格式,有: Bernouli 分布,期望与方差: 对于x的观察数据集 ,似然函数是 μ 的函数,假定 xi 之间独立,有: 从频率论角度,我们可以用最大化似然函数的方法(等价于最大化ln函数)来评估 μ 值,似然函数的自然对数有: 使得 lnp(D|μ)=0 ,得到μ 的最大似然估计: 也即是样本均值,x=1的个数为m,则: 对于仍硬币实验,总共仍了3次,且出现的都是正面,那么μ ML= 1,预测以后都是扔出正面了,最大似然估计造成了over-fitting。对于小样本集更容易引起该问题,后面会介绍引入μ .. 阅读全文
posted @ 2014-02-15 09:49 嗯Jeffrey 阅读(2034) 评论(0) 推荐(0) 编辑
摘要: 从一个回归问题开始:给定一个real-valued input variable x,通过这个observation预测a real-valued target variable t 。 本节将讨论一个简单的曲线拟合例子,这个例子将贯穿整章用于梳理一些重要的机器学习概念。 training set: N个obeservations: x(x1,,xN)T target values: t(t1,tN)T train... 阅读全文
posted @ 2013-12-19 23:22 嗯Jeffrey 阅读(3728) 评论(0) 推荐(1) 编辑
摘要: 以手写数字自动识别为例,每个手写数字用2828 像素图像显示,这样每个样本可以用一个维数为794的向量x表示。那么将问题转换为建立一套识别机制,通过输入x ,识别出数字的真实值,并且输出该值,值的范围是 09 。这是个典型的分类问题,自然的想法是通过一些人工的规则和基于形状的辨别方法,但是由于手写体的变化太多,这种固定的处理模式在现实中效果非常不好。一种更好的解决方式就是 machine learning了: training set N个数字图像 {X1,,XN} ,用于.. 阅读全文
posted @ 2013-12-18 22:07 嗯Jeffrey 阅读(292) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示