量化程序员
做一个温柔,平静,的人。 不嗔,不怒,不悲,不痴。

导航

 

相关性分析之前的准备工作

1.看一眼数据,数值的,连续型的,才能进行相关性分析。
一眼看过去就明显不相关的两组数据就不要浪费时间了。
2.数据的分布
如果数据符合正态分布,则度量相关性使用皮尔逊相关系数
如果不符合正太分布,则使用斯皮尔曼相关系数

操作步骤

数据预处理,整理数据类型,格式,在pandas中处理好。
今天只是记录spss软件的使用方式,拿一个股指期货的收盘价和开盘价来进行分析。

1.打开spss读取数据

数据视图:
变量视图:

2. 进行分析

点击分析---相关性---双变量


选择变量---设置双侧检验---选择相关系数(由于这两个变量不符合正太分布,选择了斯皮尔曼相关系数)

看结果:sig是双尾显著性,sig<0.05,说明两组数据相关性显著,否则就没必要看相关系数了。
再看相关系数,相关系数,相关系数是【-1,1】,如果是0就说明不想关。如果是1或者-1,就是完全的线性相关。大于0.7就说明是强相关了。
相关性的强弱具体看项目的需要,和个人的把握。

由于我们选的是开盘价和收盘价,毫无疑问是有极强的相关性的。 我们可以看到,相关系数超过了0.99

总结下:

1.读取数据到spss
2.分析---相关性---双变量,选择双变量,---选择单侧还是双侧sig检验(显著性检验,这是前提,不显著的话相关系数不用看了)---选择合适的相关系数
3.确定,查看结果
sig显著的前提下,查看相关系数。

相关性检验是做套利分析的前提。

posted on 2023-11-20 21:10  白茶不清  阅读(519)  评论(0编辑  收藏  举报