相关性分析之前的准备工作
1.看一眼数据,数值的,连续型的,才能进行相关性分析。
一眼看过去就明显不相关的两组数据就不要浪费时间了。
2.数据的分布
如果数据符合正态分布,则度量相关性使用皮尔逊相关系数
如果不符合正太分布,则使用斯皮尔曼相关系数
操作步骤
数据预处理,整理数据类型,格式,在pandas中处理好。
今天只是记录spss软件的使用方式,拿一个股指期货的收盘价和开盘价来进行分析。
1.打开spss读取数据
数据视图:
变量视图:
2. 进行分析
点击分析---相关性---双变量
选择变量---设置双侧检验---选择相关系数(由于这两个变量不符合正太分布,选择了斯皮尔曼相关系数)
看结果:sig是双尾显著性,sig<0.05,说明两组数据相关性显著,否则就没必要看相关系数了。
再看相关系数,相关系数,相关系数是【-1,1】,如果是0就说明不想关。如果是1或者-1,就是完全的线性相关。大于0.7就说明是强相关了。
相关性的强弱具体看项目的需要,和个人的把握。
由于我们选的是开盘价和收盘价,毫无疑问是有极强的相关性的。 我们可以看到,相关系数超过了0.99
总结下:
1.读取数据到spss
2.分析---相关性---双变量,选择双变量,---选择单侧还是双侧sig检验(显著性检验,这是前提,不显著的话相关系数不用看了)---选择合适的相关系数
3.确定,查看结果
sig显著的前提下,查看相关系数。
相关性检验是做套利分析的前提。