SciTech-Mathmatics-Probability+Statistics:Quantifing Uncertainty_统计分析: SciTech-Mathmatics-Probability+Statistics:Quantifing Uncertainty_统计数据分析: PROBABILITY DISTRIBUTIONS(常用概率分布)

一般数学表示方法

  • 概率数学表示方法

    X:Random Variable()x:rnorm,X,,f:pdf,dnorm,Probability Distribution Function of Random Variable X,F:cdf,pnorm,Cumulative Density Function of Random Variable X,P(X=k):pmd,Probability Mass Distribution

  • 常用概率分布

    • Discrete(离散概率分布)

      • Discrete Uniform(离散均匀分布)
      • Bernoulli(伯努利分布)
      • Binomial(二项式分布)
      • Poisson(泊松分布)
      • Hypergeometric(超几何分布)
    • Continuous(连续概率分布)
      • Uniform(均匀分布)
      • Normal/Gaussian(正态分布)
      • Exponential(指数分布)
      • Gamma分布
      • Beta分布
      • Gumbel分布

离散概率分布

Discrete Uniform(离散均匀分布)

  • Definition:每次抽样存在多种可能结果,每种结果出现的概率完全一致.
    即 X的 Sample Space 为 a finite set S={k1,k2,,kn},
     P(X=ki)=1n,  i [1, n], iN

  • Example:

    • Roll a die(掷骰子):
      • Sample Space is a finite set: S={1,2,,6}
      • ELO(Equally Likely Outcomes): P(X=i)=16, i1,2,,6
  • R代码:

      >>> x <- sample(c(1,2,6,8,9), 10000, prob=rep(0.2,5),replace=TRUE)
      >>> table(x)## 另一种方法:用index
      >>> idx <- runif(10000,0,5); idx <- ceiling(idx)
      >>> x <- c(1,2,6,8,9)[idx]
      >>> table(x)
    

Bernoulli(伯努利试验)

  • Definition: 仅存在两种可能结果一次 experiment

  • Example:

    • Toss a coin(扔硬币) ONE TIME: H(Head, 正面朝上),T(Tail, 反面朝上)
      P(X=H)=π,  P(X=T)=1π
  • R代码:

      >>>进行1000次伯努利试验
      >>> outcome <- sample(c(T,F), 1000, prob=c(0.8, 0.2), replace=TRUE)
      >>> ot <- table(outcome)
      >>> ot <- ot/sum(ot)
    

Binomial

  • Definition:

    • 重复 n次独立 Bernoulli 的 概率分布就是Binomial(二项式)分布:
      • Sample Space 为 1,0,
      • 出现 1 的概率是 p,
      • n 次结果有 X 次的 1,
      • X 的可能取值范围是 [1, n] of N
  • Notation: 记作 XB(n,p)

  • p.f. of Binomial:
    P(X)=CnXπX(1π)nX)
    CnX=n!(nX)!X!

  • 图形特征

    • π接近 0.5 时,图形是对称的;
    • π0.5 愈远,对称性愈差, 但随 n 的增大, 分布趋于对称.
    • 当 n→∞ 时,只要 π 不太靠近 01,
      nPn(1P) 都大于 5 时, 二项分布 近似于 正态分布
    • 二项分布的图形取决于 πn ,高峰在 μ=nπ
  • Binomial 示例1
    一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行有放回的摸球游戏。
    因此每一次摸到黄球的概率是0.4,摸到白球的概率是0.6。
    这个实验有三个特点:

    1. 各次摸球是彼此独立的;每次摸球只有二种可能的结果,或黄或白;
    2. 重复进行无穷次的相互独立试验。
    3. 每次摸到黄球(或摸到白球)的概率是固定的

    具备这三点后, n次有X次摸到黄球(或白球)的概率分布就是二项分布。

  • Application:
    医学研究上的应用医学研究,很多现象的观察结果是以两分类变量来表示的,
    如阳性与阴性、治愈与未愈、生存与死亡等等。
    如果:

    • 每个观察对象, Positive结果概率均为 π,Negative结果概率均为 (1π)
    • 而且各个观察对象的结果是相互独立的,
    • 重复观察 n个人,

    发生Positive结果的人数X的概率分布为二项分布,记作B(X;n,π).

posted @   abaelhe  阅读(14)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示