爱上统计学
第5章 计算相关系数
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数
正相关,负相关
决定系数(coefficient of determination),有的教材上翻译为判定系数,也称为拟合优度。拟合优度的定义:意义:拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高.观察点在回归直线附近越密集。
相关 不一定是 因果
其他重要的相关系数:卡方系数,等级二列相关系数,点二列相关系数,斯皮尔曼等级相关系数,皮尔逊相关系数。
第7章 你和假设:检验你的问题
抽样误差:测量样本和总体特征近似程度的量数
零假设:两个变量无关的陈述,比如:9年级学生的ABC记忆考试的平均成绩和12年级学生的平均成绩没有差异。
研究假设:变量间有关的明确陈述
1.无方向研究假设:9年级学生的ABC记忆考试的平均成绩 不同于 12年级学生的平均成绩
2.有方向研究假设:12年级学生的平均成绩 比 级学生的ABC记忆考试的平均成绩 高
零假设和研究假设的区别:
1.一个无关,一个有关
2.零假设对应总体,研究假设对应样本
3.零假设是被动验证,研究假设是主动验证
第8章 你的曲线是正态的吗?--- 概率和概率的重要性
概率是理解正态曲线的基础,也是理解 推论统计 的基础
概率研究是决定我们在陈述特定的发现是 真 的可信度基础
人数和智商的分布,零假设就是正态分布
z值 表示数据分布在x轴上的特定位置,z值越大(例如 1个标准差,2.6个标准差),距离均值越远
如果数据分布是正态分布,曲线的不同面积可以用标准差 或者 z值 的不同数值来表示。
曲线面积,微积分,参照B1表(使用这个表,不再需要原始值)
关于标准值,注意两方面
1.虽然我们重点关注z值,但是还有其他类型的标准值
2.标准值与标准差完全不同。标准值来自预先确定均值和标准差的数据分布。
第IV部分 显著性差异 - 使用推论统计
注意,是“推论统计”,前面介绍的都是“描述统计”
第9章 显著性
在大多数涉及假设检验的科学研究中一定存在一定数量的不能控制的误差,你愿意承担的风险水平 或者 概率水平 就是显著水平。说白了,就是误差的概率
比如,20次中有1次,不是由于假定的原因(母亲是否工作),而是由于其他未知的原因引起的。你的工作就是尽可能减少这种可能性。 误差控制在 .05概率水平下。
推论统计介绍:描述统计是用于描述样本的特征,而推论统计是基于样本特征推断总体的某些特征。
进行推论的最有用的工具之一就是统计显著性检验。
最后都会使用特定的统计显著性检验对零假设进行检验。
第10章 两个群体的t检验 -- 不同群体的均值检验
独立样本t检验介绍 - 就饮食紊乱的问题, 对澳大利亚的大学生 和 印度的大学生 两个群体的均值 进行比较,主要是 饮食态度 和 肥胖恐惧症
t检验:两个相互独立的群体在一个(或多个)变量的平均值上是否有差异。独立是说两个群体在任何方面都不相关
计算检验统计量,公式
几乎每一个统计检验都有特定的假设支持检验的使用,例如,t检验的一个主要的假设是“两个群体中每个群体的变异性的量是相等的"
t检验是进行真是的统计检验,并从应用的角度完整地理解显著性的第一步。。。
第11章 两个群体的t检验 -- 两个相关群体的均值检验
非独立样本t检验介绍 - 孩子阅读的问题, t=1.23,有差异,但差异不显著。
非独立均值检验,表明是相同的群体在两种不同的条件下进行相同的研究。
计算检验统计量,公式
第12章 两个群体是否太多? - 尝试进行方差分析
训练念书 与 技能得分 的关系
因为需要检验”两个以上“的群体,并比较这些群体的平均成绩,所以使用 方差分析。
方差分析的检验统计量 是 F统计量
方差分析的类型
1.简单方差分析,也叫一元方差分析, 只分析一个变量
2.析因设计,是分析一个以上的处理变量
计算F检验统计量,公式
第13章 两个因素 - 析因方差分析