lxinghua

博客园 首页 新随笔 联系 订阅 管理

描述统计分析是进行其他统计分析的基础和前提。在描述性分析中,通过各种统计图及数字特征量尅对样本来自的总体特征有比较准确的把握,从而选择正确的推断方法。

一、 频数分布分析(Frequencies)

基本概念:频数分布分析主要通过频数分布表、条图和直方图,以及集中趋势和离散趋势的各种统计量,描述数据的分布特征。

通过 分析>描述统计>频率 路径进入频率统计主对话框

   

1. 在频率统计主对话框中点击统计即可进入统计量对话框,针对需求进行各项目勾选即可

2. 在频率统计主对话框中点击图表即可进入图表对话框,针对统计数据选择需求图表即可

  在选择直方图时,可勾选在直方图中显示正态曲线,则输出图像为正态分布图。

3. 在频率统计主对话框中点击格式即可进入格式对话框,针对统计数据选择需求输出格式即可

 

① 排序方式,按需求选择即可

② 多个变量:比较变量为将所有变量的描述统计的结果显示在同一张表格中;按变量组织输出为每个变量分别输出单独的描述统计表格

案例:从某单位职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果

二、描述性统计分析(Descriptives)

基本概念:描述性统计分析主要用以计算描述集中趋势和离散趋势的各种统计量,此外还有一个重要功能是对变量做标准化变换,即Z变换。

通过 分析>描述统计>描述 路径进入描述统计主对话框

1. 在描述统计主对话框中点击选项即可进入选项对话框,针对统计需求进行各项目勾选即可

案例:分析不同性别演员获得奥斯卡的年龄差异性

三、探索性分析(Explore)

基本概念:探索分析是在对数据的基本特征 统计量有初步连接的基础上,对数据进行的更为深入详细的描述性观察分析。在一般描述性统计指标的基础上,增加了有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户四开对数据进行进一步的方案。

探索性分析有以下几个目的:

  •  对数据进行初步检查,判断有无离群点和极端值;
  • 对前提条件假设,如正态分布和方差齐性进行检查,不满足正态分布和方差齐性时,提示数据转换方法,最后决定使用参数方法或非参数方法;
  • 了解组间差异的特征。

通过 分析>描述统计>探索 路径进入探索统计主对话框

1. 在探索统计主对话框中点击统计即可进入统计对话框,针对统计需求进行项目勾选即可

  • 描述:生成描述性统计表格,表中显示样本数据的描述统计量,包括平均值、中位数、5%调整平均数、标准误差、方差、标准差、最大/小值、组距、四分位数、峰/偏度、峰/偏度的标准误差; 均值置信区间可输入,一般在95;
  • M-估计量:计算并生成稳健估计量。M估计在计算时对所有观测量赋予权重,随观测量距分布中心的远近而变化,通过给远离中心值的数据赋予较小的权重来减小异常值的影响;
  • 离群值:输出分析数据中5个最大值和5个最小值作为异常嫌疑值;
  • 百分位数:计算并显示制定的百分位数,包括5%、10%、25%、50%、75%、90%、95%等。

2. 在探索统计主对话框中点击图即可进入图形对话框,针对统计需求进行输出图表选择

  • 箱图:因子级别并置-为每个因变量创建一个箱图,在每个箱图 内根据分组变量的不同水平的取值创建箱型单元;因变量并置-为每个分组变量的水平创建一个箱图,在每个箱图内用不同的颜色区分不同因变量所对应的箱型单元,方便用户进行比较;无-不创建箱图
  • 描述图:茎叶图-主要由频率、茎、叶组成,在图中按从左到右的顺序依次排列,在图的底端,注明了茎的宽和每一叶所代表的观测量数;直方图-直接绘制直方图
  • 函检验的正态图:进行正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图
  • 含莱文检验的分布:伸展与级别检验,对所有的展布-水平图进行方差齐性检验和数据转换,同时输出回归直线的斜率及方差齐性的级别检验,但如果没有指定分组变量,则此选项无效

3. 在探索统计主对话框中点击图即可进入选项对话框,针对统计需求进行输出类型选择

  • 成列排除个案:对所有的分析过程剔除分组变量和因变量中所有带有缺失值的观测量数据;
  • 成对排除个案:同时剔除带缺失值的观测值及与缺失值有成对关系的观测量。在当前分析过程中用到的变量数据中剔除带有缺失值的观测量数据,在其他分析过程中可能包含缺失值;
  • 报告值:将分组变量的缺失值单独分为一组,在输出频数表的同时输出缺失值。

案例:分析中国南北城市的温度差异

在进行分析处理数据时,有时需要对分析结果做出简要的回报,即需要统计报表制作技术。SPSS的报表功能是以表格的形式,按照一定的要求对数据进行制备行列表,以展现数据内自爱的联系和规律,让用户在具体实施分析之前能够实现对数据的特征与属性进行大致的了解,以方便用户根据数据的特征进一步采取合适的统计分析方法或者分析工具。

运用统计报表功能可以得到许多统计学的基本统计量,如均值、方差、标准差、极大值、极小值、偏度系数、峰度系数和标准误差等,也能进行正态性检验、独立性检验以及多变量之间的相关关系。

分析>报告  即可进入报表制作选项界面。

1. 代码本:用于反映数据库中变量属性特征信息;

导入数据选择代码本进入代码本对话框:其有变量、输出、统计三个操作界面。

代码本可以用来对当前数据库文件以及文件中变量信息进行描述,并可对分类变量进行计数和百分比计算,对数值变量进行均值、标准差、中位数和四分位数间距的计算。

案例:现测量某人群性别、民族、身高和体重数据,运用代码本进行文件及变量属性特征进行描述。

2. OLAP立方:按照一个或者多个分组变量所分的组,计算目标变量(需为定量变量)的总值、均值以及其他基本统计量;

主对话框选择分析变量后,可以点击统计、差值、标题三个标签,分析对数据的统计量,统计方式以及输出标题进行选择命名。

案例:仍以上一节案例进行分析。

3. 个案摘要:主要用于按照制定的分组变量统计分析不同水平的交叉汇编,对变量进行记录列表,并计算相应的统计量;

主对话框选择分析变量后,可以点击统计、选项两个个标签,分析对数据的统计量,输出标题进行选择命名。

4. 按行显示:按行汇总;

四个选项按钮

 

5. 按列显示:用于生成复杂报表,它们均可对输出的表格进行精确的定义,以满足用户的不同需求。

三个选项按钮。

不同的输出报告模式,但统计方式是一样的!根据展示需求进行选择。

posted on 2023-05-25 21:38  興華  阅读(195)  评论(0编辑  收藏  举报