Excel-绘制累积分布函数CDF(Cumulative Distribution Function)

Excel绘制累积分布函数CDF(Cumulative Distribution Function)

https://www.pianshen.com/article/95711145637/ 

一、累积分布函数(Cumulative Distribution Function)

累积分布函数(Cumulative Distribution Function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布

一般以大写CDF标记,与概率密度函数probability density function(小写pdf)相对。

累计分布函数的特性:

①因为累计分布函数是计算x点左侧的点的数量,所以累计分布函数CDF是单调递增的。

②CDF并没有直方图变化剧烈,但是CDF包含了相同的信息,并且减少了噪声。

③由于CDF不存在装箱(分段),因此比直方图能更好的展现数据。

④所有的CDF中,在x趋近最小值时,CDF趋近于0,当x趋近最大值时,CDF趋近与1(100%)

⑤对于给定的数据集,CDF是唯一的

在分析变量的分布情况时,累计分布函数非常有用。虽然excel没有CDF的绘图功能,但是了解CDF绘图的原理后,就能利用散点图功能绘制CDF

 

 

二、绘制方法:

有如下数据,欲绘制变量X的累计分布函数。

 

 

 

三、步骤:

  1. 将变量X从小到大进行排序
  2. 计算变量X的分位数值。另取一列命名为“CDF“,查看有多少行数据(此处为底部数据行序号-1),比如200行数据,则在C2单元格中输入“=1/200“,在C3单元格中输入 “=C2+1/200“,将选中C3单元格双击,将函数运用于余下单元格,计算变量X的分位数。
  3. 绘图,选中变量X和CDF两列,选择“插入-散点图“,如下所示:

 

 

 

4. 调整X轴范围,如果有outlier,可以调整变量X的范围,不显示outlier

 

 

完毕。

 

posted @ 2021-06-11 11:34  荣格  阅读(6910)  评论(0编辑  收藏  举报