PT_离散型随机变量下的分布:几何/超几何/幂律
离散型随机变量下的分布:几何/超几何/幂律
🎈几何分布
-
P ( X = k ) = p 1 ( 1 − p ) k − 1 , k = 1 , 2 , ⋯ P(X=k)=p^1(1-p)^{k-1},k=1,2,\cdots P(X=k)=p1(1−p)k−1,k=1,2,⋯
-
n 重 b e r n o u l l i 试验的第 k 次试验才首次成功的概率服从几何分布 n重bernoulli试验的第k次试验才首次成功的概率服从几何分布 n重bernoulli试验的第k次试验才首次成功的概率服从几何分布
- 试验的结果只有两种,成功/不成功
-
从分布律上看 , p 的指数为 1 ( 而且是 k 次试验中最后一次 ) 从分布律上看,p的指数为1(而且是k次试验中最后一次) 从分布律上看,p的指数为1(而且是k次试验中最后一次)
-
其余全部为失败的试验 , 共有 k − 1 次 其余全部为失败的试验,共有k-1次 其余全部为失败的试验,共有k−1次
-
满足这样的事件序列只有一种: ( ⋂ i = 1 k − 1 A ‾ ) A (\bigcap_{i=1}^{k-1}\overline{A})A (⋂i=1k−1A)A
-
从而得到几何分布
-
-
X 服从参数为 p 几何分布 , 记为 X ∼ G ( p ) X服从参数为p几何分布,记为X\sim G(p) X服从参数为p几何分布,记为X∼G(p)
-
几何分布的无记忆性
-
设每次试验成功率为p
- 重复独立地做试验
- 已知做了n次都没有成功(等价于需要做超过n次才有可能成功/试验成功对应的试验次数X>n)
- 记C={继续做m次依然没有成功的概率}
-
设X为首次成功时试验进行的次数
-
X ∼ G ( p ) X\sim G(p) X∼G(p)
-
A={n次试验都没有成功}
-
p ( X > n ) = ∑ i = n + 1 + ∞ ( 1 − p ) k − 1 p = p ∑ i = n + 1 + ∞ ( 1 − p ) k − 1 = 几何级数 a 1 1 − q p ⋅ ( 1 − p ) [ n + 1 ] − 1 1 − ( 1 − p ) = p ( 1 − p ) n p = ( 1 − p ) n p(X>n)=\sum\limits_{i=n+1}^{+\infin}(1-p)^{k-1}p \\ =p\sum\limits_{i=n+1}^{+\infin}(1-p)^{k-1} \xlongequal{几何级数\frac{a_1}{1-q}} p\cdot\frac{(1-p)^{[n+1]-1}}{1-(1-p)} =\frac{p(1-p)^n}{p} =(1-p)^n p(X>n)=i=n+1∑+∞(1−p)k−1p=pi=n+1∑+∞(1−p)k−1几何级数1−qa1p⋅1−(1−p)(1−p)[n+1]−1=pp(1−p)n=(1−p)n
-
互斥事件的并的计算(X的不同取值间是互斥的)
-
-
B={做了n+m次依然没有成功}
- 可以表示为: P ( X > n + m ) = ( 1 − p ) m + n P(X>n+m)=(1-p)^{m+n} P(X>n+m)=(1−p)m+n
-
{ X > n + m } ⊂ { X > n } , { X > n + m } { X > n } = { X > n + m } \set{X>n+m}\sub \set{X>n},\set{X>n+m}\set{X>n}=\set{X>n+m} {X>n+m}⊂{X>n},{X>n+m}{X>n}={X>n+m}
-
所求概率可以表示为
-
P ( C ) = P ( { X > m + n } ∣ { X > n } ) = P ( { X > m + n } ∩ { X > n } ) P ( X > n ) = P ( { X > m + n } ) P ( X > n ) = ( 1 − p ) m + n ( 1 − p ) n = ( 1 − p ) m P(C)=P(\set{X>m+n}|\set{X>n}) \\ =\frac{P(\set{X>m+n}\cap \set{X>n})}{P(X>n)} \\=\frac{P(\set{X>m+n})}{P(X>n)} \\=\frac{(1-p)^{m+n}}{(1-p)^n} \\=(1-p)^m P(C)=P({X>m+n}∣{X>n})=P(X>n)P({X>m+n}∩{X>n})=P(X>n)P({X>m+n})=(1−p)n(1−p)m+n=(1−p)m
-
结论表明,之前做的n次试验没有成功的条件下,在做m试验的成功率和(先前做的次数)n没有关系
-
-
🎈超几何分布
-
P
(
X
=
k
)
=
(
n
k
)
(
N
−
M
n
−
k
)
(
N
n
)
P(X=k)=\frac{\binom{n}{k}\binom{N-M}{n-k}}{\binom{N}{n}}
P(X=k)=(nN)(kn)(n−kN−M)
- k = 0 , 1 , ⋯ , n k=0,1,\cdots,n k=0,1,⋯,n
-
X
服从于参数为
n
,
N
,
M
的超几何分布
X服从于参数为n,N,M的超几何分布
X服从于参数为n,N,M的超几何分布
- X ∼ H ( n , N , M ) X\sim H(n,N,M) X∼H(n,N,M)
更具体的随机变量X的取值范围
- 根据超集和分布的三个参数n,N,M
-
m
a
x
(
k
)
=
m
i
n
(
N
,
n
)
max(k)=min(N,n)
max(k)=min(N,n)
- 最好的情况下,取得正品的数量也不能够超过N,n中的任何一个
-
m
i
n
(
k
)
=
m
a
x
(
0
,
n
−
(
N
−
M
)
)
min(k)=max(0,n-(N-M))
min(k)=max(0,n−(N−M))
- 最坏的情况下,正品的数量也不会少于
(
0
,
n
−
(
N
−
M
)
)
(0,n-(N-M))
(0,n−(N−M))中的任何一个
- 前者(0)代表,N件产品中全部都是次品
-
后者
(
n
−
(
N
−
M
)
)
代表
,
N
产品中次品的数量
(
N
−
M
)
少于被抽取的产品数量
n
后者(n-(N-M))代表,N产品中次品的数量(N-M)少于被抽取的产品数量n
后者(n−(N−M))代表,N产品中次品的数量(N−M)少于被抽取的产品数量n
- 为了抽够 n 间 , 至少要再抽 n − ( N − M ) 件产品 ( 此时可以确定都是正品了 ) 为了抽够n间,至少要再抽n-(N-M)件产品(此时可以确定都是正品了) 为了抽够n间,至少要再抽n−(N−M)件产品(此时可以确定都是正品了)
- 最坏的情况下,正品的数量也不会少于
(
0
,
n
−
(
N
−
M
)
)
(0,n-(N-M))
(0,n−(N−M))中的任何一个
-
m
a
x
(
k
)
=
m
i
n
(
N
,
n
)
max(k)=min(N,n)
max(k)=min(N,n)
背景
- 上述参数可以理解为:
- 有N件商品
- M件正品( M ⩽ N M\leqslant N M⩽N)
- N − M 件次品 N-M件次品 N−M件次品
- 抽取n件
- k 件正品 k件正品 k件正品
- n − k 件次品 n-k件次品 n−k件次品
超几何分布问题
-
m + n 件产品 ( m 件是次品 ) 中取 k 件 , 所有可能的取法有 ( m + n k ) 种 m+n件产品(m件是次品)中取k件,所有可能的取法有\binom{m+n}{k}种 m+n件产品(m件是次品)中取k件,所有可能的取法有(km+n)种
-
每取出 k 件后算一次完整试验 每取出k件后算一次完整试验 每取出k件后算一次完整试验
-
记事件 A i 表示某次取 k 件产品的试验中 , 有 i 件是次品 A_i表示某次取k件产品的试验中,有i件是次品 Ai表示某次取k件产品的试验中,有i件是次品
-
那么有 Ω = ⋃ i = 0 k A i , ( i = 0 , 1 , 2 , ⋯ , k ) \Omega=\bigcup\limits_{i=0}^{k}{A_i},(i=0,1,2,\cdots,k) Ω=i=0⋃kAi,(i=0,1,2,⋯,k)
- 其中: A i 作为基本事件 , 有互斥关系 : A i A j ≠ ∅ , ( i ≠ j ) A_i作为基本事件,有互斥关系:A_iA_j\neq \varnothing,(i\neq j) Ai作为基本事件,有互斥关系:AiAj=∅,(i=j)
-
P ( Ω ) = P ( ⋃ i = 0 k A i ) = ∑ i = 0 k P ( A i ) = 1 (export1) P(\Omega)=P(\bigcup_{i=0}^{k}A_i)=\sum\limits_{i=0}^{k}P(A_i) =1\tag{export1} P(Ω)=P(i=0⋃kAi)=i=0∑kP(Ai)=1(export1)
-
-
取k件的试验产生的样本空间中的样本点总数为: N ( Ω ) = ( m + n k ) N(\Omega)=\binom{m+n}{k} N(Ω)=(km+n)
-
这k件中有i件次品的可能有 ( m i ) ( n k − i ) 中情况 \binom{m}{i}\binom{n}{k-i}中情况 (im)(k−in)中情况
- 也就是说 N ( A i ) = ( m i ) ( n k − i ) 也就是说N(A_i)=\binom{m}{i}\binom{n}{k-i} 也就是说N(Ai)=(im)(k−in)
-
其中
:
(
n
r
)
=
C
n
r
=
n
!
r
!
(
n
−
r
)
!
其中:\binom{n}{r}=C^r_n=\frac{n!}{r!(n-r)!}
其中:(rn)=Cnr=r!(n−r)!n!
- 表示二项式系数(组合数)
-
-
-
这类问题称为超几何分布
超几何分布的概率公式
-
P ( A i ) = N ( A i ) N ( Ω ) = ( m i ) ( n k − i ) ( m + n k ) P(A_i)=\frac{N(A_i)}{N(\Omega)}=\frac{\binom{m}{i}\binom{n}{k-i}}{\binom{m+n}{k}} P(Ai)=N(Ω)N(Ai)=(km+n)(im)(k−in)
-
结合上面的公式:export1,
- 1 = ∑ i = 0 k P ( A i ) = ∑ i = 0 k ( m i ) ( n k − i ) ( m + n k ) 1=\sum\limits_{i=0}^{k}P(A_i)=\sum\limits_{i=0}^{k}\frac{\binom{m}{i}\binom{n}{k-i}}{\binom{m+n}{k}} \\ 1=i=0∑kP(Ai)=i=0∑k(km+n)(im)(k−in)
🎄幂律分布
-
P
(
X
=
k
)
=
C
k
γ
P(X=k)=\frac{C}{k^\gamma}
P(X=k)=kγC
- K = 1 , 2 , ⋯ K=1,2,\cdots K=1,2,⋯
- γ > 1 \gamma>1 γ>1
- C 为满足规范性条件的归一化常数 C为满足规范性条件的归一化常数 C为满足规范性条件的归一化常数
- X 服从参数为 γ 的幂律分布 X服从参数为\gamma的幂律分布 X服从参数为γ的幂律分布
- 幂律分布是复杂系统的指纹
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了