SPSSAU问卷分析快速入门指南
首先了解基本统计知识(大约5分钟),接着选择正确的研究方法进行结果解读;与此同时,了解一些问卷研究的思路使得研究更加顺手。与此同时,掌握一些数据清理的技能更好,比如对异常数据处理。
01. 基础知识
(1)数据类型识别
数据共分为两类,定量和定类数据:
术语 | 说明 | 举例 |
定量数据 | 数字大小具有比较意义 | 您对天猫的满意度情况(非常不满意,比较不满意,中立,比较满意,非常满意) |
定类数据 | 数字大小代表分类 | 性别(男和女),专业(文科、理科、工科) |
(2)P值的意义
p 值是统计学名词,其用于测量数据间的规律情况把握程度。如果p 值小于0.01即说明某件事情的发生至少有99%的把握,如果p 值小于0.05(并且大于0.01)则说明某件事情的发生至少有95%的把握。
研究人员想研究不同性别人群的购买意愿是否有明显的差异,如果对应的p 值小于0.05,则说明呈现出0.05水平的显著性差异,即说明不同性别人群的购买意愿有着明显的差异,而且对此类差异至少有95%的把握,绝大多数研究均希望p 值小于0.05,即说明有影响,有关系,或者有差异等。
(3)量表
量表答项类似于“非常同意”、“同意”、“不一定”、“不同意”、“非常不同意”,也或者“非常满意”、“比较满意”、“中立”、“比较不满意”,“非常不满意”等。大多数统计方法均只能针对量表。量表是一种非常典型的定量数据,当然个别情况时也可以将其看成定类(即认可态度不同的几类群体,但这种时候非常少)。
02. 分析方法选择使用
在确认好数据类型后,接着便可选择正确的研究方法。如下说明:
参考资料:https://spssau.com/helps/basics/concept.html
SPSSAU建议:先描述想研究什么用一句话描述。话里面拆成X和Y:然后结合X与Y的数据类型,选择对应的方法。
比如性别/专业等为定类数据,那么基本情况分析部分,直接使用频数分析即可;
如果数据中有量表态度题,那么基本情况分析时,可计算量表题的平均值,了解样本的平均态度情况;
进一步想深入分析差异关系,如果是定类和定类关系,比如‘性别’和‘是否吸烟’的关系,那么可使用交叉(卡方)分析;如果是定类和定量关系,比如‘性别’和‘身高’的关系,那么可使用方差分析;
进一步想深入分析影响关系,即X对于Y的影响,如果Y是定量数据(比如身高),那么可使用线性回归。如果说Y是定类数据(比如是否愿意购买电影票,购买哪种类型的电影票),那么就需要使用Logit回归分析,比如Y为是否愿意(yes和no两项),那么就使用二元Logit回归,如果是多个类别(比如购买‘爱情类’,‘喜剧类’,‘恐怖类’),那么此时使用多分类Logit回归即可。
如果数据中有量表数据即态度题,那么通常需要使用测量数据的真实性和量表设计的有效性,可使用信度和效度分析。
如果数据中有多选题(多选题是一种特殊的定类数据,其分析应该以‘某个多选题的所有选项作为整体’一次性分析),可使用SPSSAU问卷研究里面的‘多选题’,‘单选-多选’,‘多选-多选’,‘多选-单选’。分别分析多选题各项的选择比例,也或者单选题和多选题的差异关系,也或者多选题和多选题的差异关系,也或者多选题和单选题的差异关系。
03. 问卷思路剖析
问卷思路上一般分成三个部分,分别是基本情况分析,差异关系研究和影响关系研究。
- 首先是对问卷数据做基本的描述分析,结合数据类型,选择使用频数分析,或者描述分析即可;
- 接着研究差异关系情况,结合数据类型选择使用交叉卡方分析,或者方差分析即可;
- 接着研究影响关系情况,即X对于Y的影响,结合Y的数据类型,选择使用线性回归或者Logit回归即可。
参考资料如下:https://spssau.com/helps/basics/framemodule.html
(1)基本情况分析
分析方法:频数分析/描述分析
- 了解样本特征情况,基本认知情况,基本态度情况
- 比如个体基本特征(性别,年龄,学历,专业)等基本分布情况如何;比如对于疫情的认知情况或态度情况如何?
(2)探索规律(差异关系)
分析方法:交叉卡方分析/方差分析
- 深入分析差异情况,找出数据规律
- 比如分析不同性别/学历/专业群体,他们对于疫情认知态度差异情况如何?
(3)探索规律(影响关系)
分析方法:线性回归/Logit回归
- 深入分析更进一步的影响关系情况,找出数据规律
- 比如分析疫情认知态度情况 对 ‘疫情期间是否外出就读’的影响关系情况?
(4)其它
如果数据有量表题,那么可以测量数据的真实性和量表题设计的有效性。(仅针对量表题)
分析方法:信度分析/效度分析
- 探究数据的真实性和量表题设计的有效性
- 比如使用量表题询问‘消费升级’的态度情况,那么回收数据是否真实,且是否真的测量了‘消费升级’这个概念。
04.数据清理技能
数据分析前,有可能需要对数据进行清理,比如某个标题需要修改下,也比如数据中有大篇幅没有填写,也或者很多乱答(都选择同一个答案),那么此时需要做‘无效样本’处理。
与此同时,数据分析的时候,比如想把学历‘小学/初中/高中/大学/研究生’共5个类别,现在想组合成3个类别,分别是‘高中及以下/大学/研究生’,那么此时需要使用数据编码功能。
参考资料:
https://spssau.com/helps/dataprocessing/invalid.html
https://spssau.com/helps/dataprocessing/coding.html
「更多内容登录SPSSAU官网了解」