第一章 常用统计学术语
生物统计学(第五版)目录
第五版前言
第一版前言
第一章 概论
第一节 生物统计学的概念
第二节 统计学发展概况
一、古典记录统计学
二、近代描述统计学
三、现代推断统计学
第三节 常用统计学术语
一、总体与样本
二、参数与统计数
三、变量与资料
四、因素与水平
五、处理与重复
六、效应与互作
七、准确性与精确性
八、误差与错误
第四节 生物统计学的内容与作用
思考练习题
第二章 试验资料整理与特征数计算
第一节 试验资料的搜集与整理
一、试验资料的类型
二、试验资料的搜集
三、试验资料的整理
第二节 试验资料特征数的计算
一、平均数
二、变异数
思考练习题
第三章 概率与概率分布
第一节 概率基础知识
一、概率的概念
二、概率的计算
三、概率分布
四、大数定律
第二节 几种常见的理论分布
一、二项分布
二、泊松分布
三、正态分布
第三节 统计数的分布
一、抽样试验与无偏估计
二、样本平均数的分布
三、样本平均数差数的分布
四、t分布
五、x2分布
六、F分布
思考练习题
第四章 统计推断
第一节 假设检验的原理与方法
一、假设检验的概念
二、假设检验的步骤
三、双尾检验与单尾检验
四、假设检验中的两类错误
第二节 样本平均数的假设检验
一、一个样本平均数的假设检验
二、两个样本平均数的假设检验
第三节 样本频率的假设检验
一、一个样本频率的假设检验
二、两个样本频率的假设检验
第四节 参数的区间估计与点估计
一、参数区间估计与点估计的原理
二、一个总体平均数斓那涔兰朴氲愎兰?
三、两个总体平均数差数一的区间估计与点估计
四、一个总体频率声的区间估计与点估计
五、两总体频率差数P1-Pt的区间估计与点估计
第五节 样本方差的同质性检验
一、一个样本方差的同质性检验
二、两个样本方差的同质性检验
三、多个样本方差的同质性检验
思考练习题
第五章 X2检验
第一节 X2检验的原理与方法
第二节 适合性检验
第三节 独立性检验
一、2×;2列联表的独立性检验
二、2×;c列联表的独立性检验
三、r×;c列联表的独立性检验
思考练习题
第六章 方差分析
第一节 方差分析的基本方法
一、方差分析的基本原理
二、数学模型
三、平方和与自由度的分解
四、统计假设的显著性检验——F检验
五、多重比较
第二节 单因素方差分析
一、组内观测次数相等的方差分析
二、组内观测次数不相等的方差分析
第三节 二因素方差分析
一、无重复观测值的二因素方差分析
二、具有重复观测值的二因素方差分析
第四节 多因素方差分析
第五节 方差分析缺失数据的估计
一、缺失一个数据的估计方法
二、缺失两个数据的估计方法
第六节 方差分析的基本假定和数据转换
一、方差分析的基本假定
二、数据转换
思考练习题
第七章 直线回归与相关分析
第一节 回归和相关的概念
第二节 直线回归分析
一、直线回归方程的建立
二、直线回归的数学模型和基本假定
三、直线回归的假设检验
四、直线回归的区间估计
五、直线回归的应用及注意问题
第三节 直线相关
一、相关系数和决定系数
二、相关系数的假设检验
三、相关系数的区间估计
四、应用直线相关的注意事项
思考练习题
第八章 可直线化的非线性回归分析
第一节 非线性回归的直线化
一、曲线类型的确定
二、数据变换的方法
第二节 倒数函数曲线
第三节 指数函数曲线
第四节 对数函数曲线
第五节 幂函数曲线
第六节 Logistic生长曲线
一、Loglslic生长曲线的由来和基本特征
二、Logmtic生长曲线方程的配合
思考练习题
第九章 试验设计及其统计分析
第一节 试验设计的基本原理
一、试验设计的意义
二、生物学试验的基本要求
三、试验设计的基本要素
四、试验误差及其控制途径
五、试验设计的基本原则
第二节 对比设计及其统计分析
一、对比设计
二、对比设计试验结果的统计分析
第三节 随机区组设计及其统计分析
一、随机区组设计
二、随机区组设计试验结果的统计分析
第四节 拉丁方设计及其统计分析
一、拉丁方设计
二、拉丁方设计试验结果的统计分析
第五节 裂区设计及其统计分析
一、裂区设计
二、裂区设计试验结果的统计分析
第六节 正交设计及其统计分析
一、正交表及其特点
二、正交试验的基本方法
三、正交设计试验结果的统计分析
思考练习题
第十章 协方差分析
第一节 协方差分析的作用
一、降低试验误差,实现统计控制
二、分析不同变异来源的相关关系
三、估计缺失数据
第二节 单因素试验资料的协方差分析
一、计算变量各变异来源的平方和、乘积和与自由度
二、检验x和y是否存在直线回归关系
三、检验矫正平均数□间的差异显著性
四、矫正平均数□间的多重比较
第三节 二因素试验资料的协方差分析
一、乘积和与自由度的分解
二、检验x和y是否存在直线回归关系
三、检验矫正平均数□间的差异显著性
第四节 协方差分析的数学模型和基本假定
一、协方差分析的数学模型
二、协方差分析的基本假定
思考练习题
第十一章 多元线性回归与多元相关分析
第一节 多元线性回归分析
一、多元线性回归模型
二、多元线性回归方程的建立
三、多元线性回归的假设检验和置信区间
第二节 多元相关分析
一、多元相关分析
二、偏相关分析
思考练习题
第十二章 逐步回归与通径分析
第一节 逐步回归分析
一、逐个淘汰不显著自变量的回归方法
二、逐个选人显著自变量的回归方法
第二节 通径分析
一、通径与通径系数的概念
二、通径系数的求解方法
三、通径分析的假设检验
思考练习题
第十三章 多项式回归分析
第一节 多项式回归的数学模型
第二节 多项式回归方程的建立
一、多项式回归方程的建立与求解
二、多项式回归方程的图示
第三节 多项式回归方程的假设检验
第四节 相关指数
第五节 正交多项式回归分析
一、正交多项式回归分析原理
二、正交多项式回归分析示例
思考练习题
主要参考文献
附表
索引
统计学发展概况
1. 古典记录统计学(1650-1850):概率论,大数定律,抽样调查,正太分布理论
2. 近代描述统计学(1850-1925):中位数、百分位数、四分位数,分布,相关,回归
3. 现代推断统计学(1900-1950):t分布与检验,F分布与检验,统计假设检验学说
常用统计学术语
一、总体与样本
具有相同性质或属性的个体所组成的集合称为总体(population),它是指研究对象的全体;
组成总体的基本单元称为个体(individual);
从总体中抽出若干个体所构成的集合称为样本(sample);
总体又分为有限总体和无限总体:
含有有限个个体的总体称为有限总体(finitude popuoation);
包含有极多或无限多个体的总体称为无限总体(infinitude popuoation).
构成样本的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小(sample size),样本容量常记为n。
一般在生物学研究中,通常把n≤30的样本叫小样本,n >30的样本叫大样本。对于小样本和大样本,在一些统计数的计算和分析检验上是不一样的。
研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。
二、变量与常量
变量,或变数,指相同性质的事物间表现差异性或差异特征的数据。是研究者在确定了研究目的后,所观测的试验指标
常量,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
变量的观察结果可以定量的,也可以是定性的,其结果称为变量值(value of variable)或观测值(observed value),也称为数据、资料(data)
三、参数与统计数
为了表示总体和样本的数量特征,需要计算出几个特征数,包括平均数和变异数(极差、方差、标准差等)。
描述总体特征的数量称为参数(parameter),也称参量。常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差;
描述样本特征的数量称为统计数(staistic),也称统计量。常用拉丁字母表示统计数,例如用x表 示样本平均数,用S表示样本标准差。
四、效应与互作
通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。
互作,又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。
五、机误与错误
随机误差,也叫 抽样误差(sampling error) 。这是由于试验中无法控制的内在和外在的偶然因素所造成。如试验动物的初始条件、饲养条件、管理措施等尽管在试验中力求一致,但也不可能达到绝对一致,所以随机误差带有偶然性质,在试验中,即使十分小心也是不可避免的。如果通过良好的试验设计、正确的试验操作,增加抽样或试验次数,随机误差可能减小,但不可能完全消灭。统计上的试验误差一般都指随机误差。随机误差越小,试验精确性越高。
系统误差,也叫片面误差 (lopsided error)。 这是由于试验条件控制不一致、测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。
六、准确性与精确性
准确性(accuracy),也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。设某一试验指标或性状的真值为μ,观测值为 x,若 x与μ相差的绝对值|x-μ|越小, 则观测值x的准确性越高; 反之则低。
精确性(precision),也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。若观测值彼此接近,即任意二个观测值xi 、xj 相差的绝对值|xi -xj |越小,则观测值精确性越高;反之则低。
七、 因素与水平
试验指标(experimental index)=变量: 为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。
试验因素( experimental factor): 试验中所研究的影响试验指标的因素叫试验因素,简称因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。通常用A、B、C表示
因素水平(level of factor): 试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。通常用A1,A2,A3表示
八、处理与重复
试验处理(treatment): 事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具体饲喂哪一种饲料。
试验单位( experimental unit ): 在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。
重复(repetition): 在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4个重复。