拓端tecdat|R语言编程指导中使用概率分布:dnorm,pnorm,qnorm和rnorm
原文链接:http://tecdat.cn/?p=11040
在这里,我将讨论哪些函数可用于处理正态分布:dnorm,pnorm,qnorm和rnorm。
R中的分布函数
有四个关联的函数, 四个正态分布函数是:
- d范数:正态分布的密度函数
- p范数:正态分布的累积密度函数
- q范数:正态分布的分位数函数
- r范数:从正态分布中随机抽样
概率密度函数:dnorm
概率密度函数(PDF,简称:密度)表示观察具有特定值的测量值的概率,因此密度上的积分始终为1。 XX,正常密度定义为
使用密度,可以确定事件的概率。例如,您可能想知道:一个人的IQ恰好为140的可能性是多少?。在这种情况下,您将需要检索IQ分布在值140处的密度。可以用100的平均值和15的标准差对IQ分布进行建模。相应的密度为:
通过这些数据,我们现在可以回答初始问题以及其他问题:
## [1] "0.076%"
## [1] "0.384%"
## [1] "26.284%"
累积密度函数:pnorm
累积密度(CDF)函数是单调增加的函数,因为它通过
为了直观了解CDF,让我们为IQ数据创建一个图:
如我们所见,所描绘的CDF显示了IQ小于或等于给定值的可能性。这是因为pnorm
默认情况下计算低尾巴,即P[ X< = x ]P[X<=X]。利用这些知识,我们可以以略有不同的方式获得一些先前问题的答案:
## [1] "25.249%"
## [1] "0.383%"
请注意,pnorm的结果与手动汇总通过dnorm所获得的概率所得的结果相同。此外,通过设置lower.tail = FALSE
,dnorm
可用于直接计算p值,该p值用于衡量观察值的可能性至少与获得的值一样高。
分位数功能:qnorm
分位数函数只是累积密度函数(iCDF)的反函数。因此,分位数函数从概率映射到值。让我们看一下分位数函数P[ X< = x ]P[X<=X]:
使用分位数函数,我们可以回答与分位数有关的问题:
## [1] 89.88265
## [1] 110.1173
## 0% 25% 50% 75% 100%
## -Inf 89.88265 100.00000 110.11735 Inf
随机采样函数:rnorm
当您想从正态分布中抽取随机样本时,可以使用rnorm
。例如,我们可以rnorm
用来模拟IQ分布中的随机样本。
请注意,我们进行调用set.seed
是为了确保随机数生成器始终生成相同的数字序列以实现可重复性。
▍关注我们
【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。
▍咨询链接:http://y0.cn/teradat
▍联系邮箱:3025393450@qq.com