离散最大似然法与 OI

若总体属于离散型,其分布律在参数 \(\theta\) 作用下 \(P\{X=x\}=p(x;\theta),\Theta=\{\theta\}\) 的形式已知,设 \(X_1,X_2,\dots,x_n\)\(X\) 的样本,则其联合分布律为:

\[\prod_{i=1}^np(x_i;\theta) \]

\(x_1,x_2\dots,x_n\) 为一组已知的(实验得出的)样本值,则事件 \(\{\forall i\in[1,n],X_i=x_i\}\) 发生概率为:

\[L(\theta)=L(x_1,x_2,\dots,x_n;)=\prod_{i=1}^np(x_i;\theta),\theta\in\Theta \]

这称为似然函数。

我们定义最大似然函数:

\[L(\hat{\theta})=\max_{\theta\in\Theta}L(\theta) \]

这样的与样本值有关的 \(\hat{\theta}(x_1,x_2,\dots,x_n)\) 称为最大似然估计值,而统计量 \(\hat{\theta}(X_1,X_2,\dots,X_n)\) 称为最大似然估计量。

我们一般希望知道 \(\hat{\theta}\)

很多情形下,\(p(x,\theta)\) 关于 \(\theta\) 可微。我们可以通过解

\[\frac{d}{d\theta}L(\theta)=0 \]

得到它。由于 \([\ln L(\theta)]'=\dfrac{L'(\theta)}{L(\theta)}\),我们可以通过解

\[\frac{d}{d\theta}\ln L(\theta)=0 \]

得到相同解,而后面的方程通常是容易的。

例题:

image

image

8s,1024MB。

解:我们考虑把初始集合分配随机权值,然后集合表示为数,集合异或可以表示为数异或。

然后我们可以判断 \(0\) 得到 \(30\) 分。

我们考虑随机化。考虑我们多次随机把一些数置 \(0\),设置 \(0\) 比例为 \(c_i\)

再进行多次实验,设得到空集 \(a_i\) 次,非空集 \(b_i\) 次。

可以得出,在参数 \(\theta=|T|\) 的情况下,其概率分布 \(p(A_i=a_i,B_i=b_i;\theta)\) 为:

\[\prod (c_i^{\theta})^{a_i}(1-c_i^{\theta})^{b_i}\\ L(\theta)=\prod (c_i^{\theta})^{a_i}(1-c_i^{\theta})^{b_i}\\ \ln L(\theta)=\theta\sum a_i\ln c_i+\sum b_i\ln(1-c_i^{\theta})\\ \]

有结论:

\(f\)\(I\) 上的凸函数,\(g\)\(J(f(x)\subset J)\) 上递增,且凸性相同。

可以证明: \(g(f)\)\(I\) 上有相同的凸性。

而若干个凸函数的和是凸函数。所以 \(\ln(1-c_i^{\theta})\) 为凸函数。

于是你可以三分得到最大似然估计值。

直接随机取点 bitset,唐完了

posted @ 2023-11-02 15:57  British_Union  阅读(87)  评论(1编辑  收藏  举报