PT_离散型随机变量下的分布:几何/超几何/幂律

离散型随机变量下的分布:几何/超几何/幂律

🎈几何分布

  • P ( X = k ) = p 1 ( 1 − p ) k − 1 , k = 1 , 2 , ⋯ P(X=k)=p^1(1-p)^{k-1},k=1,2,\cdots P(X=k)=p1(1p)k1,k=1,2,

    • n 重 b e r n o u l l i 试验的第 k 次试验才首次成功的概率服从几何分布 n重bernoulli试验的第k次试验才首次成功的概率服从几何分布 nbernoulli试验的第k次试验才首次成功的概率服从几何分布

      • 试验的结果只有两种,成功/不成功
    • 从分布律上看 , p 的指数为 1 ( 而且是 k 次试验中最后一次 ) 从分布律上看,p的指数为1(而且是k次试验中最后一次) 从分布律上看,p的指数为1(而且是k次试验中最后一次)

      • 其余全部为失败的试验 , 共有 k − 1 次 其余全部为失败的试验,共有k-1次 其余全部为失败的试验,共有k1

      • 满足这样的事件序列只有一种: ( ⋂ i = 1 k − 1 A ‾ ) A (\bigcap_{i=1}^{k-1}\overline{A})A (i=1k1A)A

      • 从而得到几何分布

    • X 服从参数为 p 几何分布 , 记为 X ∼ G ( p ) X服从参数为p几何分布,记为X\sim G(p) X服从参数为p几何分布,记为XG(p)

几何分布的无记忆性
  • 设每次试验成功率为p

    • 重复独立地做试验
    • 已知做了n次都没有成功(等价于需要做超过n次才有可能成功/试验成功对应的试验次数X>n)
      • 记C={继续做m次依然没有成功的概率}
  • 设X为首次成功时试验进行的次数

    • X ∼ G ( p ) X\sim G(p) XG(p)

    • A={n次试验都没有成功}

      • p ( X > n ) = ∑ i = n + 1 + ∞ ( 1 − p ) k − 1 p = p ∑ i = n + 1 + ∞ ( 1 − p ) k − 1 = 几何级数 a 1 1 − q p ⋅ ( 1 − p ) [ n + 1 ] − 1 1 − ( 1 − p ) = p ( 1 − p ) n p = ( 1 − p ) n p(X>n)=\sum\limits_{i=n+1}^{+\infin}(1-p)^{k-1}p \\ =p\sum\limits_{i=n+1}^{+\infin}(1-p)^{k-1} \xlongequal{几何级数\frac{a_1}{1-q}} p\cdot\frac{(1-p)^{[n+1]-1}}{1-(1-p)} =\frac{p(1-p)^n}{p} =(1-p)^n p(X>n)=i=n+1+(1p)k1p=pi=n+1+(1p)k1几何级数1qa1 p1(1p)(1p)[n+1]1=pp(1p)n=(1p)n

      • 互斥事件的并的计算(X的不同取值间是互斥的)

    • B={做了n+m次依然没有成功}

      • 可以表示为: P ( X > n + m ) = ( 1 − p ) m + n P(X>n+m)=(1-p)^{m+n} P(X>n+m)=(1p)m+n
    • {   X > n + m   } ⊂ {   X > n   } , {   X > n + m   } {   X > n   } = {   X > n + m   } \set{X>n+m}\sub \set{X>n},\set{X>n+m}\set{X>n}=\set{X>n+m} {X>n+m}{X>n},{X>n+m}{X>n}={X>n+m}

    • 所求概率可以表示为

      • P ( C ) = P ( {   X > m + n   } ∣ {   X > n   } ) = P ( {   X > m + n   } ∩ {   X > n   } ) P ( X > n ) = P ( {   X > m + n   } ) P ( X > n ) = ( 1 − p ) m + n ( 1 − p ) n = ( 1 − p ) m P(C)=P(\set{X>m+n}|\set{X>n}) \\ =\frac{P(\set{X>m+n}\cap \set{X>n})}{P(X>n)} \\=\frac{P(\set{X>m+n})}{P(X>n)} \\=\frac{(1-p)^{m+n}}{(1-p)^n} \\=(1-p)^m P(C)=P({X>m+n}{X>n})=P(X>n)P({X>m+n}{X>n})=P(X>n)P({X>m+n})=(1p)n(1p)m+n=(1p)m

      • 结论表明,之前做的n次试验没有成功的条件下,在做m试验的成功率和(先前做的次数)n没有关系

🎈超几何分布

  • P ( X = k ) = ( n k ) ( N − M n − k ) ( N n ) P(X=k)=\frac{\binom{n}{k}\binom{N-M}{n-k}}{\binom{N}{n}} P(X=k)=(nN)(kn)(nkNM)
    • k = 0 , 1 , ⋯   , n k=0,1,\cdots,n k=0,1,,n
  • X 服从于参数为 n , N , M 的超几何分布 X服从于参数为n,N,M的超几何分布 X服从于参数为n,N,M的超几何分布
    • X ∼ H ( n , N , M ) X\sim H(n,N,M) XH(n,N,M)
更具体的随机变量X的取值范围
  • 根据超集和分布的三个参数n,N,M
    • m a x ( k ) = m i n ( N , n ) max(k)=min(N,n) max(k)=min(N,n)
      • 最好的情况下,取得正品的数量也不能够超过N,n中的任何一个
    • m i n ( k ) = m a x ( 0 , n − ( N − M ) ) min(k)=max(0,n-(N-M)) min(k)=max(0,n(NM))
      • 最坏的情况下,正品的数量也不会少于 ( 0 , n − ( N − M ) ) (0,n-(N-M)) (0,n(NM))中的任何一个
        • 前者(0)代表,N件产品中全部都是次品
        • 后者 ( n − ( N − M ) ) 代表 , N 产品中次品的数量 ( N − M ) 少于被抽取的产品数量 n 后者(n-(N-M))代表,N产品中次品的数量(N-M)少于被抽取的产品数量n 后者(n(NM))代表,N产品中次品的数量(NM)少于被抽取的产品数量n
          • 为了抽够 n 间 , 至少要再抽 n − ( N − M ) 件产品 ( 此时可以确定都是正品了 ) 为了抽够n间,至少要再抽n-(N-M)件产品(此时可以确定都是正品了) 为了抽够n,至少要再抽n(NM)件产品(此时可以确定都是正品了)
背景
  • 上述参数可以理解为:
  • 有N件商品
    • M件正品( M ⩽ N M\leqslant N MN)
    • N − M 件次品 N-M件次品 NM件次品
  • 抽取n件
    • k 件正品 k件正品 k件正品
    • n − k 件次品 n-k件次品 nk件次品
超几何分布问题
  • m + n 件产品 ( m 件是次品 ) 中取 k 件 , 所有可能的取法有 ( m + n k ) 种 m+n件产品(m件是次品)中取k件,所有可能的取法有\binom{m+n}{k}种 m+n件产品(m件是次品)中取k,所有可能的取法有(km+n)

    • 每取出 k 件后算一次完整试验 每取出k件后算一次完整试验 每取出k件后算一次完整试验

      • 记事件 A i 表示某次取 k 件产品的试验中 , 有 i 件是次品 A_i表示某次取k件产品的试验中,有i件是次品 Ai表示某次取k件产品的试验中,i件是次品

        • 那么有 Ω = ⋃ i = 0 k A i , ( i = 0 , 1 , 2 , ⋯   , k ) \Omega=\bigcup\limits_{i=0}^{k}{A_i},(i=0,1,2,\cdots,k) Ω=i=0kAi,(i=0,1,2,,k)

          • 其中: A i 作为基本事件 , 有互斥关系 : A i A j ≠ ∅ , ( i ≠ j ) A_i作为基本事件,有互斥关系:A_iA_j\neq \varnothing,(i\neq j) Ai作为基本事件,有互斥关系:AiAj=,(i=j)
        • P ( Ω ) = P ( ⋃ i = 0 k A i ) = ∑ i = 0 k P ( A i ) = 1 (export1) P(\Omega)=P(\bigcup_{i=0}^{k}A_i)=\sum\limits_{i=0}^{k}P(A_i) =1\tag{export1} P(Ω)=P(i=0kAi)=i=0kP(Ai)=1(export1)

      • 取k件的试验产生的样本空间中的样本点总数为: N ( Ω ) = ( m + n k ) N(\Omega)=\binom{m+n}{k} N(Ω)=(km+n)

      • 这k件中有i件次品的可能有 ( m i ) ( n k − i ) 中情况 \binom{m}{i}\binom{n}{k-i}中情况 (im)(kin)中情况

        • 也就是说 N ( A i ) = ( m i ) ( n k − i ) 也就是说N(A_i)=\binom{m}{i}\binom{n}{k-i} 也就是说N(Ai)=(im)(kin)
        • 其中 : ( n r ) = C n r = n ! r ! ( n − r ) ! 其中:\binom{n}{r}=C^r_n=\frac{n!}{r!(n-r)!} 其中:(rn)=Cnr=r!(nr)!n!
          • 表示二项式系数(组合数)
  • 这类问题称为超几何分布

超几何分布的概率公式
  • P ( A i ) = N ( A i ) N ( Ω ) = ( m i ) ( n k − i ) ( m + n k ) P(A_i)=\frac{N(A_i)}{N(\Omega)}=\frac{\binom{m}{i}\binom{n}{k-i}}{\binom{m+n}{k}} P(Ai)=N(Ω)N(Ai)=(km+n)(im)(kin)

  • 结合上面的公式:export1,

    • 1 = ∑ i = 0 k P ( A i ) = ∑ i = 0 k ( m i ) ( n k − i ) ( m + n k ) 1=\sum\limits_{i=0}^{k}P(A_i)=\sum\limits_{i=0}^{k}\frac{\binom{m}{i}\binom{n}{k-i}}{\binom{m+n}{k}} \\ 1=i=0kP(Ai)=i=0k(km+n)(im)(kin)

🎄幂律分布

  • P ( X = k ) = C k γ P(X=k)=\frac{C}{k^\gamma} P(X=k)=kγC
    • K = 1 , 2 , ⋯ K=1,2,\cdots K=1,2,
    • γ > 1 \gamma>1 γ>1
    • C 为满足规范性条件的归一化常数 C为满足规范性条件的归一化常数 C为满足规范性条件的归一化常数
    • X 服从参数为 γ 的幂律分布 X服从参数为\gamma的幂律分布 X服从参数为γ的幂律分布
  • 幂律分布是复杂系统的指纹
posted @   xuchaoxin1375  阅读(24)  评论(0编辑  收藏  举报  
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
点击右上角即可分享
微信分享提示