超高频数据分析方法
SPSSAU助力每个写论文的大学生,今天一文总结了毕业论文数据分析常用的12类方法,包括文科生需要的简单数据分析、理科生常用的各类模型、或者医学生常用的实验方法通通都给你分类汇总好了,赶紧转发给你为了数据分析头秃的室友吧~
一、基本描述分析
基本描述统计分析包括频数分析、描述分析、分类汇总;用于对收集的数据进行基本的说明(点击方法名称一键直达方法帮助手册):
- 频数分析:针对定类数据进行分析,例如针对样本的性别、年龄、年级等人口学变量进行频数分析,了解样本分布情况。一般使用频数、百分比、饼图等形式进行描述。
- 描述分析:针对定量数据进行分析,常见的指标有平均值、标准差、最大值、最小值、中位数等;更深入的描述指标包括百分位数、峰度、偏度、变异系数等。
- 分类汇总:用于研究不同分类时的汇总情况,输出的指标为汇总结果。比如不同区域分类项,销售额(汇总项)的差异情况。
二、差异关系研究
差异比较是常见一类分析方法,如两组或多组均数、率、分布的差异比较。一般采用假设检验类方法进行统计分析。论文写作中常用的差异关系研究方法有方差分析、t检验、卡方检验、非参数检验。
接下来,分别对4类差异分析方法进行说明。
1、t检验
t检验用于分析X定类数据(仅2类)与Y定量数据之间的差异情况,按照研究内容和数据类型等不同,可分为以下3类:
2、方差分析
方差分析用于进行X定类数据(2类及以上)与Y定量数据之间的差异关系研究;按照研究内容和数据类型等不同,可分为以下5类:
3、卡方检验
卡方检验用于分析定类数据与定类数据之间的差异情况,按照研究内容和数据类型等不同,可分为以下5类:
4、非参数检验
方差分析与t检验均属于参数检验的范围,通常需要数据满足正态性和方差齐性才能够使用,当数据不满足正态性或方差齐性时,研究定类数据与定量数据之间的差异性可以使用非参数检验进行分析。
非参数检方法与参数检验方法对应表如下:
三、相关影响关系研究
相关影响关系研究用于分析变量之间的关系,包括两部分内容,相关关系研究和回归影响关系研究。涉及的方法主要包括相关分析、线性回归、logistic回归及非线性回归(点击方法名称一键直达方法帮助手册)。
- 相关分析:根据适用条件不同,可以选择Pearson相关、Spearman相关、Kendall相关等相关系数进行变量相关关系研究
- 线性回归:因变量Y为定量数据时研究X对Y的影响关系
- logistic回归:因变量Y为定类数据时研究X对Y的影响关系,根据Y个数类型等不同,可分为二元logistic回归、有序logistic回归和多分类logistic回归
- 曲线与非线性回归:主要针对定量数据分析,当线性回归不再适用时进行影响关系研究
四、信息浓缩及聚类研究
数据降维是对变量信息的浓缩,聚类是对个案信息的分类。
1、信息浓缩
信息浓缩方法可以帮助人们在不损失太多信息的情况下,将数据和信息进行简化和压缩,如从数量庞大的指标变量中提取少数几个公因子,在尽可能降低信息损失的前提下用新的公因子变量取代原始变量的信息。
2、聚类分析
聚类分析是通过数据建模简化数据的一种方法,“物以类聚,人以群分”正是对聚类分析最好的诠释。它用于将抽象对象的集合,分组为由类似的对象组成的多个类。这种分析的目标是在相似的基础上收集数据来分类(点击下方方法名称一键直达方法帮助手册)。
- ref="https://spssau.com/helps/advancedmethods/cluster.html">聚类分析:根据数据类型的不同,SPSSAU聚类分析将自动进行K-means聚类/K-modes聚类/K-prototype聚类
- ref="https://spssau.com/helps/advancedmethods/hirCluster.html">分层聚类:按变量(标题)聚类,此时应该使用分层聚类,并且结合聚类树状图进行综合判定分析
五、权重关系研究
权重研究是用于分析各因素或指标在综合体系中的重要程度,最终构建出指标评价体系。权重计算的方法可分为主观赋权法和客观赋权法,如下说明:
六、数据预测方法
数据预测是利用当前和历史信息(数据)进行分析、挖掘、判定,以得出对未来数据的预测。较常见是针对时间序列数据的预测、包括ARIMA模型、指数平滑法等;或者利用灰色系统理论进行预测,如GM(1,1)模型;马尔科夫预测也比较常用。
七、优劣决策方法
优劣决策是指在多个可行选项中,通过一定的评价标准和评估方法,选择最优或最符合目标的决策方案的过程。优劣决策隶属于综合评价分析,其分析方法通常包括TOPSIS法、熵权TOPSIS法、秩和比法和Vikor法。
八、常用综合评价方法
综合评价是一类针对多指标进行科学决策的研究方法。
九、问卷研究分析方法
对问卷数据资料进行研究分析是量化研究的重要内容,根据问卷题型的不同,所获得的数据类型也不同,这影响到采取何种统计方法的问题。问卷从广义上可分为普通问卷和量表问卷,二者涉及的方法各有不同,接下来分别进行说明。
1、普通问卷
普通问卷主要包括单选题、多选题等题目,那么主要涉及到的分析方法可能频数统计、多选题分析、卡方检验、方差分析、t检验、线性回归、logistic回归等等。以上绝大多数方法都介绍过,在此介绍一下多选题分析。
2、量表问卷
量表问卷(李克特量表)进行分析时,涉及的方法会更多更复杂一些。常见的如信度分析、效度分析、项目分析、验证性因子分析、路径分析、结构方程模型、中介效应、调节效应、有调节的中介效应分析等等。
十、常用市场研究分析
市场研究是一种通过收集、分析和解释市场数据,以了解市场需求、竞争情况、消费者行为和趋势等信息,为企业制定营销策略和决策提供支持的过程。及的方法有PSM分析、联合分析、NPS分析、KANO模型等等。
十一、医学数据分析
医学数据分析中除差异性分析比较常用外,比率与风险分析、剂量分析、生存分析、重复测量方差分析、ROC曲线分析也比较常用。
十二、一致性评价检验方法
一致性检验的目的在于比较不同方法得到的结果是否具有一致性。常用方法有Kappa系数、Kendall协调系数、ICC组内相关系数、rwg组内评分者一致性、Bland-Altman图等。
以上内容在《SPSSAU科研数据分析方法与应用》这本书的中有全方位系统的介绍,这本书根据数据分析在科研中的应用情况,依次介绍数据分析入门、常用研究方法应用、数据综合评价及预测、问卷数据分析和医学数据分析等五个方面。