【数理统计】分位数
上分位数和下分位数的定义
设连续型随机变量 的分布函数为 ,概率密度函数为 ,则:
- 对于任意正数 ,称满足条件
的数为此分布的 分位数或下 分位数。
理解下 分位数:从 这个点把分布函数图像切成两个部分,左边部分面积占比 ,右边部分面积占比 。(下图右图)
- 对于任意正数 ,称满足条件
的数为此分布的上 分位数。
理解上 分位数:从 这个点把分布函数图像切成两个部分,左边部分面积占比 ,右边部分面积占比 。(下图左图)
上分位数和下分位数的关系如下:
下分位数的直观理解
分位数是数理统计中用来描述数据分布的一种统计量,它将数据集分成若干个部分,使得每个部分包含相同数量的数据点。常见的分位数包括中位数(50%分位数)、四分位数(25%和75%分位数)等。
- 中位数(Median):将数据分成两部分,中位数是数据中间的值,50%分位数。
- 四分位数(Quartiles):
- 第一四分位数(Q1):将数据下25%的点分开。
- 第二四分位数(Q2):即中位数(50%分位数)。
- 第三四分位数(Q3):将数据上25%的点分开。
假设有以下一组数据:
数据集:3, 7, 8, 12, 14, 18, 20
-
计算中位数:
- 排序后的数据为:3, 7, 8, 12, 14, 18, 20
- 中位数(Q2)是中间的值,即
12
。
-
计算四分位数:
- 第一四分位数(Q1):前半部分数据是
3, 7, 8
,中位数是7
。 - 第三四分位数(Q3):后半部分数据是
14, 18, 20
,中位数是18
。
- 第一四分位数(Q1):前半部分数据是
上分位数的直观理解
上分位数(Upper Quantile):一个分位数 的上分位数是指使得有 的数据点小于该分位数的值。
常见的上分位数:
- 上四分位数(Q1):表示25%数据点大于该值,75%数据点小于该值。
- 上中位数:在中位数(Q2)中,50%的数据点大于该值。
- 上95%分位数(即95th Percentile):表示有5%的数据点大于该值,95%的数据点小于该值。
假设我们有一组数据,表示某个考试的分数:
数据集:55, 60, 65, 70, 75, 80, 85, 90, 95, 100
计算上分位数:
-
上四分位数(Q1):
- Q1 = 65(25%的数据点大于65)。
-
上中位数(Q2):
- Q2 = 75(50%的数据点大于75)。
-
上95%分位数:
- 95th Percentile = 95(5%的数据点大于95)。
常用分布中的分位数
不同分布的符号简写:
b
:二项分布p
:泊松分布u
:标准正态分布e
:指数分布z
:正态分布(不一定是标准的)
正态分布
若 即服从标准正态分布,则分布函数记为 。由标准正态分布的对称性可知:。显然,。
- 对于上分位数 ,有
- 对于下分位数 ,有
- 上下分位数之间的关系有 (仅标准正态分布成立)
对于自由度为 的 t 分布也有类似的结论:。当 足够大时,有:
标准正态分布中常见的分位数:
- 0.25分位数(第一四分位数 Q1):约为 -0.6745,即
- 0.50分位数(中位数 Q2):为 0,即
- 0.75分位数(第三四分位数 Q3):约为 0.6745,即
假设我们有一组服从正态分布 的随机变量,即均值为100,标准差为15。我们可以计算这些变量的分位数。
-
25%分位数(Q1):
- 使用标准正态分布的Q1值:约为 -0.6745。
- 实际分位数计算:
Q1 = 100 + (-0.6745 × 15) ≈ 90.87
。
-
50%分位数(Q2):
- 使用标准正态分布的Q2值:为 0。
- 实际分位数计算:
Q2 = 100 + (0 × 15) = 100
。
-
75%分位数(Q3):
- 使用标准正态分布的Q3值:约为 0.6745。
- 实际分位数计算:
Q3 = 100 + (0.6745 × 15) ≈ 109.12
。
卡方分布
若 ,则上分位数 是满足以下条件的值:
这意味着有 的概率观测值会大于该上分位数值。
上分位数的应用:
- 假设检验:在卡方检验中,通常使用上分位数来决定拒绝域。例如,在检验两个分类变量的独立性时,可以使用卡方统计量与上分位数进行比较。
- 置信区间:在构建卡方分布的置信区间时,也会使用上分位数。
假设我们有一个卡方分布 ,即自由度 ,我们想找出上5%分位数(,即95%分位数):
- 查卡方分布表,找到自由度为5时,与0.95对应的上分位数 。
- 结果为大约 11.070。
这意味着在自由度为5的卡方分布中,有5%的概率观察到的值会大于11.070。类似的还有 F 分布中的上分位数,此处不再赘述。
本文作者:漫舞八月(Mount256)
本文链接:https://www.cnblogs.com/Mount256/p/18610194
版权声明:本作品采用CC 4.0 BY-SA许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
2022-12-16 【组成原理-处理器】流水线技术