R语言基础 | 概率分布的表示方法

在R中各种概率函数都有统一的形式,即一套统一的 前缀+分布函数名(参数)

分布函数

注意:不同前缀,第一个参数 n 的意义不同(详见下方讲解)

连续型

 

名称 英文名 R对应的函数 参数
高斯分布 gaussian  norm n, mean=0, sd=1
指数分布 exponential  exp n, rate=1
伽玛分布(γ) gamma  gamma n, shape, scale=1
韦氏分布 Weibull  weibull n, shape, scale=1
柯西分布 Cauchy  cauchy n, location=0, scale=1
β分布 beta  beta n, shape1, shape2
t分布 Student's t t n, df
F分布 F f n, df1, df2
卡方分布 chi-squared chisq n, df
Logistic 分布 Logistic  logis n, location=0, scale=1
对数正态分布 log-normal  lnorm n, meanlog=0, sdlog=1
均匀分布 uniform  unif n, min=0, max=1

 

离散型

 

名称 英文名 R对应的函数 参数
泊松分布 Poisson  pois n, lambda
二项分布 binomail  binom n, size, prob
多项分布 multinomial  multinom n, size, prob
几何分布 geometric  geom n, prob
超几何分布 hypergeometric  hyper nn, m, n, k
负二项分布 negative binomial nbinom n, size, prob

 

前缀

  r:随机函数,生成特定分布的随机数(random)   

  d:密度函数(density)

  p:分布函数(生成相应分布的累积概率密度函数)

  q:分位数函数,能够返回特定分布的分位数(quantile)

 

代码示例

以 正态分布 为例

1. r 生成正态分布的随机数

第一个参数 n:生成随机数的个数

a = rnorm(100,0,2)  # 生成100个均值为0,标准差为2 的呈正态分布的点

 

plot(a)   # 在图上展示这些点,x轴:索引 y轴:点的数值

 

density(a) # 查看函数密度描述信息

 

hist(a)  # 直方图呈现

 

 查看概率密度图

hist(a, xlab="值", ylab="频次",xlim=c(-8,8),ylim=c(0,0.3))
lines(density(a), col="blue")

2.  d 密度函数

第一个参数 n:x 值

dnorm(0.2, 0, 2) # 计算x=0.2 处 函数的概率密度,得到一个数值

 

 3. p 分布函数

第一个参数 n:x 值

pnorm(0.2, 0, 2) # 计算x=0.2 处 累积概率密度函数值 即 x 小于 0.2 的概率(相当与对应的百分位数)

 

 4. q 分位数函数 

第一个参数 n:分位数值

qnorm(0.25, 0, 2)  # 计算下四分位数 所对应的正态分布中的那个数据

 

posted @ 2020-03-15 10:31  机器快点学习  阅读(2208)  评论(0编辑  收藏  举报