连续变量与连续变量的相关分析------ > 用相关分析

一、连续变量与连续变量的相关分析------ > 用相关分析

      相关分析是指连续变量之间的一种非严格的相依赖的变化关系,具体表现为:当一个变量发生时,另一个变量随之发生相应线性变动的关系,我们一般可以用相关系数 r 大小来衡量两个连续变量的相关性强弱(注意:不是衡量因果关系),例如衡量客户入网时长和每月话费的相关分析。

    r 的公式如下:(一般是由计算机为我们算出)

 

 

 

       但因为相关系数r是通过样本量数据计算的,而实际的总体相关系数我们是未知的,因此相关系数r是否具备足够的说服能力,我们需要进行检验对应的检验统计量是T检验,即用T来衡量两个连续变量是否有关系。

       T 统计量的原假设H0:两个变量没有相关性

       如果T 统计量发生的概率P值小于5%,,则拒绝原假设,如果P大于5%,则我们没有理由拒绝原假设,但我们也不能完全说原假设成立;比如我们分析时发现,算出两个变量的相关系数 r 非常高,但T统计量的P值大于5%(即不拒绝原假设,认为两个变量没有关系),此时并不是矛盾,这种情况的发生大多是因为样本量不够造成的,这只能说,两个变量可能存在相关性,但算出来的这个相关系数 r 的可靠性不高,我们可以通过增加样本量再算一次,来进一步分析结果。

   t 统计量公式是:(我们一般是看 t 统计量发生的概率P来判断是否拒绝原假设)

 

 引申知识:

 

posted @ 2019-04-13 21:11  后来的后来123  阅读(8814)  评论(0编辑  收藏  举报