SAS高级统计分析教程(第2版)
SAS高级统计分析教程(第2版)
第1版前言
第2版前言
第1篇 统计分析基础
1 应确保数据是值得分析的
1.1 什么是数据和/或统计资料
1.1.1 数据不等于统计资料
1.1.2 统计资料的要素
1.2 确保数据值得分析的第一道关——制订科学完善的课题设计方案
1.2.1 什么叫科学研究
1.2.2 科学研究与课题之间是什么关系
1.2.3 做课题之前为什么要制订课题设计方案
1.2.4 课题设计方案有哪些种类
1.2.5 科学完善的科研设计方案的标志
1.3 确保数据值得分析的第二道关——实时进行严格的过程质量控制
1.3.1 必须严格控制课题实施过程中的质量
1.3.2 进行质量控制的必要性
1.3.3 进行质量控制的环节与措施
1.4 确保数据值得分析的第三道关——确保数据的原始性没有被破坏
1.4.1 应有切实可行的措施确保收集的数据具有原始性
1.4.2 与常见试验设计类型对应的规范化统计表
1.5 常见不值得分析的数据种类
1.5.1 人为编造的数据是不值得分析的
1.5.2 产生于质量控制不严的数据是不值得分析的
1.5.3 经过错误的方法加工整理后的数据是不值得分析的
1.5.4 不符合特定统计分析方法要求的数据是不值得分析的
1.5.5 盲目解释基于误用统计分析方法所得到的分析结果是不可取的
1.5.6 缺失值过多的数据是不值得分析的
1.6 本章小结
2 绘制统计图
2.1 问题、数据及统计描述方法的选择
2.1.1 问题与数据
2.1.2 对数据结构的分析
2.1.3 分析目的与统计描述方法的选择
2.1.4 统计图概述
2.2 绘制单式条图
2.2.1 程序及说明
2.2.2 输出单式条图
2.3 绘制复式条图
2.3.1 程序及说明
2.3.2 输出复式条图
2.4 绘制百分条图
2.4.1 程序及说明
2.4.2 输出百分条图
2.5 绘制圆图
2.5.1 程序及说明
2.5.2 输出圆图
2.6 绘制箱式图
2.6.1 程序及说明
2.6.2 输出箱式图
2.7 绘制直方图
2.7.1 程序及说明
2.7.2 输出直方图
2.8 绘制散点图
2.8.1 程序及说明
2.8.2 输出散点图
2.9 绘制普通线图
2.9.1 程序及说明
2.9.2 输出普通线图
2.10 绘制半对数线图
2.10.1 程序及说明
2.10.2 输出半对数线图
2.11 绘制P-P图和Q-Q图
2.11.1 程序及说明
2.11.2 输出P-P图
2.12 本章小结
3 统计分析方法的分类与合理选用的关键技术
3.1 统计分析方法的分类
3.1.1 概述
3.1.2 描述性统计分析
3.1.3 探索性统计分析
3.1.4 广义差异性统计分析
3.1.5 广义相关与回归分析
3.1.6 广义综合评价
3.2 合理选用统计分析方法的关键技术
3.2.1 合理选用统计分析方法的四要素
3.2.2 合理选用统计分析方法的实例演示
3.3 面对实际问题合理选用统计分析方法的要领
3.3.1 描述性统计分析
3.3.2 探索性统计分析
3.3.3 传统差异性统计分析
3.3.4 相关分析
3.3.5 回归分析
3.3.6 广义综合评价
3.4 本章小结
4 结合分析
4.1 问题与数据结构
4.1.1 实例
4.1.2 对数据结构的分析
4.1.3 统计分析目的与分析方法的选择
4.2 结合分析内容简介
4.2.1 基本概念
4.2.2 基本原理
4.3 结合分析的应用
4.3.1 用SAS分析例4-1中的资料
4.3.2 用SAS分析例4-2中的资料
4.4 本章小结
第2篇 变量间相互与依赖关系分析
5 路径分析
5.1 问题与数据结构
5.1.1 实例
5.1.2 对数据结构的分析
5.1.3 分析目的与统计分析方法的选择
5.2 路径分析内容简介
5.2.1 路径分析概述
5.2.2 适合进行路径分析的数据结构
5.2.3 路径分析的基本概念
5.2.4 路径分析的基本原理
5.2.5 路径分析的步骤
5.3 路径分析的应用
5.3.1 用REG过程实现路径分析
5.3.2 用CALIS过程实现路径分析
5.3.3 如何处理非同质资料的思考
5.3.4 用逐步多重线性回归分析方法分析例5-2的资料
5.4 本章小结
6 主成分分析
6.1 问题与数据结构
6.1.1 实例
6.1.2 对数据结构的分析
6.1.3 分析目的与统计分析方法的选择
6.2 主成分分析内容简介
6.2.1 主成分分析概述
6.2.2 主成分分析的基本原理
6.2.3 主成分的计算步骤及性质
6.2.4 与主成分分析有关的其他内容
6.2.5 PRINCOMP过程简介
6.3 主成分分析的应用
6.3.1 SAS程序
6.3.2 主要分析结果及解释
6.4 本章小结
7 变量聚类分析
7.1 问题与数据结构
7.1.1 实例
7.1.2 对数据结构的分析
7.1.3 分析目的与统计分析方法的选择
7.2 变量聚类分析内容简介
7.2.1 变量聚类分析的概念
7.2.2 变量聚类分析的聚类统计量
7.2.3 适合进行变量聚类分析的数据结构
7.2.4 VARCLUS过程简介
7.3 变量聚类分析的应用
7.3.1 SAS程序
7.3.2 主要分析结果及解释
7.4 本章小结
8 典型相关分析
8.1 问题与数据结构
8.1.1 实例
8.1.2 对数据结构的分析
8.1.3 分析目的与统计分析方法的选择
8.2 典型相关分析内容简介
8.2.1 典型相关分析概述
8.2.2 适合进行典型相关分析的数据结构
8.2.3 典型相关变量和典型相关系数的定义及解法
8.2.4 典型相关系数的假设检验
8.2.5 典型冗余分析
8.2.6 CANCORR过程简介
8.3 典型相关分析的应用
8.3.1 SAS程序
8.3.2 主要分析结果及解释
8.4 本章小结
9 多元多重线性回归分析
9.1 问题与数据结构
9.1.1 实例
9.1.2 对数据结构的分析
9.1.3 统计分析目的与统计分析方法的选择
9.2 多元多重线性回归分析内容简介
9.2.1 基于普通最小二乘法筛选自变量的思路
9.2.2 何为偏最小二乘回归分析
9.2.3 偏最小二乘回归分析的基本原理与步骤
9.3 偏最小二乘回归分析的应用
9.3.1 问题与数据结构
9.3.2 用两种检验方法来决定抽取几对主成分变量
9.4 如何获得较多统计量的计算结果
9.5 本章小结
10 探索性因子分析
10.1 问题与数据结构
10.1.1 实例
10.1.2 对数据结构的分析
10.1.3 分析目的与统计分析方法的选择
10.2 探索性因子分析内容简介
10.2.1 概述
10.2.2 探索性因子分析的数学模型
10.2.3 探索性因子分析中载荷矩阵A的统计意义
10.2.4 因子载荷矩阵A的估计方法
10.2.5 公因子个数的确定方法
10.2.6 因子旋转
10.2.7 因子得分
10.2.8 FACTOR过程简介
10.3 探索性因子分析的应用
10.3.1 SAS程序
10.3.2 主要分析结果及解释
10.4 本章小结
11 证实性因子分析
11.1 问题与数据结构
11.1.1 实例
11.1.2 对数据结构的分析
11.1.3 分析目的与统计分析方法的选择
11.2 证实性因子分析简介
11.2.1 概述
11.2.2 CALIS过程简介
11.3 证实性因子分析的应用
11.3.1 SAS程序
11.3.2 主要分析结果及解释
11.4 本章小结
12 结构方程模型分析
12.1 问题与数据结构
12.1.1 实例
12.1.2 对数据结构的分析
12.1.3 分析目的与统计分析方法的选择
12.2 结构方程模型简介
12.2.1 概述
12.2.2 基本原理
12.3 结构方程模型分析的应用
12.3.1 SAS程序
12.3.2 主要分析结果及解释
12.4 本章小结
第3篇 样品间亲疏、优劣或相对位置分析
13 传统综合评价
13.1 问题与数据结构
13.1.1 实例
13.1.2 对数据结构的分析
13.1.3 分析目的与统计分析方法的选择
13.2 传统综合评价方法内容介绍
13.2.1 综合评分法
13.2.2 Topsis法
13.2.3 层次分析法
13.2.4 RSR综合评价法
13.3 传统综合评价方法的应用
13.3.1 用综合评分法对例13-1的资料进行综合评价
13.3.2 用Topsis法对例13-2的资料进行综合评价
13.3.3 用层次分析法对例13-3的资料进行综合评价
13.3.4 用RSR综合评价法对例13-4的资料进行综合评价
13.4 本章小结
14 无序样品聚类分析
14.1 问题与数据结构
14.1.1 实例
14.1.2 对数据结构的分析
14.1.3 分析目的与统计分析方法的选择
14.2 无序样品聚类分析简介
14.2.1 概述
14.2.2 无序样品聚类分析方法分类
14.2.3 类的特征与个数的确定
14.2.4 无序样品聚类分析的计算原理
14.2.5 CLUSTER过程等简介
14.3 无序样品聚类分析的应用
14.3.1 SAS程序
14.3.2 主要分析结果及解释
14.4 本章小结
15 有序样品聚类分析
15.1 问题与数据结构
15.1.1 实例
15.1.2 对数据结构的分析
15.1.3 分析目的与统计分析方法的选择
15.2 有序样品聚类分析内容简介
15.2.1 概述
15.2.2 有序样品聚类分析的基本概念
15.2.3 有序样品聚类分析的计算原理
15.3 有序样品聚类分析的应用
15.3.1 SAS程序
15.3.2 主要分析结果及解释
15.4 本章小结
16 多维尺度分析
16.1 问题与数据结构
16.1.1 实例
16.1.2 对数据结构的分析
16.1.3 分析目的与统计分析方法的选择
16.2 多维尺度分析内容简介
16.2.1 概述
16.2.2 度量型多维尺度分析的计算原理
16.2.3 非度量型多维尺度分析的计算原理
16.3 多维尺度分析的应用
16.3.1 SAS程序
16.3.2 主要分析结果及解释
16.4 MDS过程简介
16.5 本章小结
第4篇 样品与变量或原因与结果之间的关联性分析
17 定量资料对应分析
17.1 问题与数据结构
17.1.1 实例
17.1.2 对数据结构的分析
17.1.3 分析目的与统计分析方法的选择
17.2 定量资料对应分析简介
17.2.1 概述
17.2.2 定量资料对应分析的基本原理
17.2.3 定量资料对应分析的实施步骤
17.3 定量资料对应分析的应用
17.3.1 SAS程序
17.3.2 主要分析结果及解释
17.4 本章小结
18 定性资料对应分析
18.1 问题与数据结构
18.1.1 实例
18.1.2 对数据结构的分析
18.1.3 分析目的与统计分析方法的选择
18.2 定性资料对应分析内容简介
18.3 定性资料对应分析的应用
18.3.1 SAS程序
18.3.2 主要分析结果及解释
18.4 本章小结
19 Shannon信息量分析
19.1 问题与数据结构
19.1.1 实例
19.1.2 对数据结构的分析
19.1.3 统计分析目的与分析方法的选择
19.2 Shannon信息量分析内容简介
19.2.1 概述
19.2.2 Shannon信息量分析的基本原理
19.3 Shannon信息量分析的应用
19.3.1 对例19-1的资料进行Shannon信息量分析
19.3.2 对例19-2的资料进行Shannon信息量分析
19.4 本章小结
第5篇 数据挖掘与分析
20 决策树分析
20.1 决策树简介
20.2 决策树的基本原理
20.3 决策树种类及决策树构造思路
20.4 递归分割的分裂准则
20.5 变量重要性检测
20.6 实际应用与结果解释
20.7 用数据挖掘模块近似实现各种决策树算法
20.8 本章小结
21 神经网络分析
21.1 前馈型神经网络简介
21.2 多层感知器的学习
21.3 模型过拟合
21.4 模型复杂性的评价
21.4.1 模型泛化能力(Generalization)的评价
21.4.2 模型选择的标准
21.5 实际应用与结果解释
21.6 本章小结
22 数据挖掘与分析
22.1 数据挖掘的基本概念
22.1.1 数据挖掘的背景
22.1.2 数据挖掘的基本概念
22.1.3 数据挖掘任务的分类
22.1.4 数据挖掘的应用
22.2 SAS企业数据挖掘器介绍
22.3 关联规则与序列规则
22.3.1 关联规则分析
22.3.2 关联规则挖掘实例分析
22.3.3 序列规则分析
22.3.4 序列规则挖掘实例分析
22.4 分类预测
22.4.1 数据准备
22.4.2 数据探索与数据转换
22.4.3 构造预测模型
22.4.4 模型评估与数据预测
22.5 本章小结
23 基因表达谱分析
23.1 基因表达谱的概念
23.2 基因表达谱的数据获取及标准化
23.2.1 基因表达谱的数据获取
23.2.2 基因表达数据的标准化
23.3 基因表达数据分析技术
23.3.1 差异表达基因的筛选
23.3.2 基因表达的聚类分析方法
23.4 基因调控网络分析
23.5 本章小结
24 生物信息分析
24.1 生物信息学定义
24.1.1 生物学问题
24.1.2 生物数据
24.1.3 计算工具
24.2 统计学在生物信息学中的应用
24.2.1 基于基因表达谱的样本分型研究
24.2.2 基于基因表达谱的样本分类研究
24.3 本章小结
第6篇 遗传资料统计分析
25 用SAS实现遗传资料统计分析
25.1 SAS/Genetics简介
25.2 ALLELE、HAPLOTYPE和HTSNP过程简介
25.2.1 数据格式
25.2.2 ALLELE过程的语法结构
25.2.3 HAPLOTYPE过程的语法结构
25.2.4 HTSNP过程的语法结构及其应用
25.3 利用CASECONTROL和FAMILY进行关联分析
25.3.1 CASECONTROL过程的语法结构
25.3.2 FAMILY过程的语法结构及其应用
25.4 亲缘系数和近交系数
25.5 结果校正和图形输出
25.5.1 平滑处理和多重检验校正
25.5.2 PSMOOTH过程的语法结构及其应用
25.5.3 %TPLOT宏及其应用
25.6 本章小结
26 遗传流行病学资料的统计分析
26.1 基因、基因型频率测定与哈代-温伯格(Hardy-Weinberg)平衡定律的验证
26.1.1 问题与数据
26.1.2 SAS程序中重要内容的说明
26.1.3 主要分析结果及解释
26.2 连锁不平衡与单体型分析
26.2.1 问题与数据
26.2.2 SAS程序中重要内容的说明
26.2.3 主要分析结果及解释
26.3 多位点基因型与疾病关联分析
26.3.1 问题与数据
26.3.2 SAS程序中重要内容的说明
26.3.3 主要分析结果及解释
26.4 标签SNP的确认与SAS程序
26.4.1 问题与数据
26.4.2 SAS程序中重要内容的说明
26.4.3 主要分析结果及解释
26.5 一般人群病例对照遗传资料的关联分析
26.5.1 问题与数据
26.5.2 SAS程序中重要内容的说明
26.5.3 主要分析结果及解释
26.6 家系数据的关联分析
26.6.1 问题与数据
26.6.2 SAS程序中重要内容的说明
26.6.3 主要分析结果及解释
26.7 本章小结
附录
附录A 胡良平统计学专著及配套软件简介
思维导图
防止博客图床图片失效,防止图片源站外链:
http://www.processon.com/chart_image/5e5b2c49e4b02bc3ad6a0e5a.png)
思维导图在线编辑链接: