关于统计学中q-q图为什么正态分布是一条直线(R语言绘图说明)
q-q图的概念说明:http://baike.baidu.com/view/4972145.htm
标准正太分布绘制代码:
x<-seq(-4,4,0.01) plot(x,dnorm(x),type='l')
样本分布:
上图中的曲线就是对样本直方图平滑后得到的,设这条曲线的函数式为:y=f(x)
如果样本是按正态分布的,那么f(x)即是一个正太分布的概率密度函数。根据正太分布的特性,我们又可以推导出:
y = f( (x-m)/std ) 就是标准正太分布的概率密度函数。其中m为样本均值,std为样本标准差。
q-q图中分位数的概念,其实就是找出样本中每一个值对应标准正太分布的x值
设标准正太分布的概率密度函数为 y= f(n),既然这些值一一对应,则有:
(x-m)/std=n
即:x=n*std+m
这是一条斜率为样本标准差,截距为m的直线,就是在q-q图中代表着正态分布的直线。
在R语言中, q-q图还有95%置信区间, 哪位要是知道这两根虚线是怎么得到的,请不吝赐教,谢谢。