二项分布及其极大似然估计

一、二项分布

二项分布:即n次独立重复试验,在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这样的单次成功/失败试验又称为伯努利试验。实际上,当n = 1时,二项分布就是伯努利分布

伯努利分布的数学公式表达如下:

 如果表示抛硬币,则正面向上的概率为x=1时,p(1)=p^1*(1-p)^(1-1)=p,反面向上的概率为x=0时,p(0)=p^0*(1-p)=1-p

由此可得:多次抛硬币就是一个二项分布,其数学公式可表示为:

 注:这里xi的下标i截图看的不清,就这样表示。

二、极大似然估计

极大似然估计,通俗理解来说,就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值

由上面可知,二项分布的损失函数表示为:

 

根据梯度下降的方法对二项分布的极大似然估计进行证明,对p进行求导:

 

 所以极值点为,也是其极大似然估计:

 其中:n为总共实验的次数,为正样本出现的次数

比如抛硬币实验: 100次,正面次数80,反面次数20,这样其极大似然估计为0.8

 

参考博客:1、一文搞懂极大似然估计

     2、二项分布

posted @ 2022-01-12 09:53  奇遇yms  阅读(10461)  评论(0编辑  收藏  举报