R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

全文链接：http://tecdat.cn/?p=32747

原文出处：拓端数据部落公众号

随着我国经济的快速发展，上市公司的经营绩效成为了一个备受关注的话题。本文旨在探讨上市公司经营绩效的相关因素，并运用数据处理、图示、检验和分析等方法进行深入研究，帮助客户对我国45家上市公司的16项财务指标进行了因子分析与聚类分析。

分析脉络如下：

数据预处理(包括缺失值，异常值，标准化这些)
数据图示
相关性检验正态性检验
做因子分析和聚类分析

查看数据

读取到r软件中：

数据预处理(包括缺失值，异常值，标准化

首先，在进行数据分析前，需要对数据进行预处理。数据预处理包括缺失值的处理、异常值的排除、标准化处理等。另外，为了减少数据误差，需要对数据进行标准化处理。

data=na.omit(data)

标准化和可视化

其次，在数据处理完成后，需要对数据进行图示。通过绘制散点图等图示，可以直观地了解各项指标的数值分布和趋势变化。同时，图示也有助于发现数据中的异常点和趋势漂移等问题。

数据的标准化及适用性检验

然后，进行相关性检验和正态性检验等统计方法。相关性检验可以通过计算相关系数的方法来判断各项指标之间的联系程度。而正态性检验则可以通过绘制概率图、矩阵图等方法，来判断数据是否符合正态分布。通过这些检验方法，可以更准确地分析数据，并确定适当的分析方法。

正态性检验

shapiro.test(data[,2])

信度检验结果

信度检验结果是指对某种测量工具（例如问卷、测试等）进行信度检验后得到的结果。信度检验是一种评估测量工具稳定性和一致性的方法，通常使用统计学方法来计算测量工具的内部一致性或者重测信度。通过信度检验，可以确定测量工具的可靠性和准确性，从而确定测量结果的可信度。信度检验结果可以帮助研究者评估测量工具的质量，以确保研究结果的可靠性和有效性。

KMO检验：

KMO检验是一种用于评估数据是否适合进行因子分析的统计方法。KMO（Kaiser-Meyer-Olkin）检验的主要目的是测量数据集中各个变量之间的相关性，以确定是否存在足够的共性方差，从而确定是否适合进行因子分析。KMO值介于0和1之间，通常认为KMO值大于0.6表示数据适合进行因子分析。如果KMO值低于0.6，则表明数据不适合进行因子分析，需要重新考虑数据收集和分析方法。

kmores=kmo(data\[,2:17])\
kmores\$overall

## [1] 0.5985173

因子分析和聚类分析

接下来，进行因子分析和聚类分析。因子分析旨在寻找出反映上市公司经营绩效的主要因素，并通过统计方法进行因素提取和旋转。而聚类分析则是将样本进行分类，以便于对不同类别的上市公司进行比较分析。

因子分析

因子分析是一种统计方法，用于确定多个变量之间的关系。它将一组相关变量分解为更少的未观察到的变量，称为因子，这些因子可以解释原始变量的方差。因子分析可用于数据降维、变量选择和构建模型等应用。它在社会科学、市场研究和心理学等领域得到广泛应用。

旋转成份矩阵

因子得分排名

K-means聚类分析上市公司经营绩效

K-means聚类分析是一种常用的无监督学习方法，用于将一组数据分成K个不同的类别。该算法通过迭代的方式将数据点分配到不同的类别中，并且通过计算每个类别的中心点来更新类别的位置。K-means聚类分析的目标是最小化每个数据点到其所属类别中心点的距离平方和，从而使得每个类别内部的数据点尽可能的相似，不同类别之间的数据点尽可能的不同。该算法的优点是简单易懂，计算速度快，适用于大规模数据集的聚类分析。

在上市公司经营绩效的分析中，可以将公司的各项经营指标作为输入数据，通过K-means聚类算法将公司分成若干类别，同一类别内的公司具有相似的经营绩效表现。这样可以帮助投资者或经营者更好地了解市场上不同公司的经营状况，从而做出更明智的投资或经营决策。