医学案例|配对样本t检验
一、案例介绍
为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了10份乳酸饮料制品,非别用脂肪酸水解法和哥特里-罗紫法测定,其结果图1。问两种测定结果是否不同?
图1
二、问题分析
本案例的分析目的是比较两种方法对同一批样本检测结果是否存在差异,属于对同一样本进行不同处理比较,所以可以使用配对样本t检验进行分析。
使用配对样本t检验有4个前提条件:
条件1:变量为定量数据;案例测得脂肪含量为定量数据,该条件满足。
条件2:分组变量包括两类,且为配对设计;案例中数据为对同一批样本使用两种不同测定方法进行研究,属于配对设计,该条件满足。
条件3:两配对数据的差值不存在明显的异常值;需要通过软件进行分析后判断。
条件4:两配对数据的差值服从或近似服从正态分布;需要通过软件进行分析后判断。
接下来,检验条件3和条件4是否满足。
三、软件操作及结果解读
(一) 异常值检验
1、理论说明
异常值,也称离群值,是指样本中的个别值,其数值明显偏离所属样本的绝大部分观测值。当数据中存在异常值时,会影响差值的平均数或者标准差,可能导致最终分析结果产生较大的偏差,对于小样本研究,比如医学上的实验数据,通常都很少,那么异常值的影响会更加显著。所以在分析前需要检查数据是否存在异常值。
2、软件操作
检验两配对数据的差值是否存在异常值,使用箱线图进行分析。在SPSSAU系统中,可视化模块,选择【箱线图】,将“差值d”放入分析项(定量)框中,操作如图2:
图2
3、结果解读
SPSSAU输出差值d的箱线图如图3:
图3
箱线图共由五个数值点构成,分别是最小观察值,25%分位数(Q1),中位数,75%分位数(Q3),最大观察值。如果数据有存在离群点即异常值,他们大于超出最大或者最小观察值,此时SPSSAU将离群点以“圆点”形式进行展示。
从上图可以看出,差值d并没有出现异常值,满足配对样本t检验的条件3。接下来检验差值d是否服从正态分布。
(二)正态性检验
1、理论说明
正态性检验的方法有很多种,小样本正态性检验最常用方法为Shapiro-Wilk检验法。该方法是1965年S.S.Shapiro 与M.B.Wilk提出用顺序统计量W来检验分布的正态性,常用于小样本资料的正态性检验,通常在3≤n≤50时使用,本案例数据均小于50,所以使用S-W检验进行分析。当样本量大于50时,可以使用Kolmogorov-Smirnov检验进行分析。
检验统计量W的计算公式为:
其中为将n个观测值从新按升序排序后的第i个观察值,为系数。计算出W值后去查表,得到对应p值。P>0.05时,不拒绝原假设,认为数据服从正态分布。
2、软件操作
在SPSSAU在线数据分析软件中,选择【正态性检验】,将“差值d”放入右侧分析项(定量)框中,操作如下图4:
图4
3、结果解读
SPSSAU输出正态性检验结果如图5:
图5
针对差值d进行正态性检验,从图5可以看出,差值d没有呈现显著性(p>0.05),意味着不拒绝原假设,差值d服从正态分布。
所以可以进行配对样本t检验。
(三)配对样本t检验
1、理论说明
配对样本t检验适用于配对设计的计量资料,在医学科研中,配对设计主要有以下情形:①两同质受试对象配成对子分别接受两种不同的处理;②同一受试对象(如同一血液样本)分别接受两种不同处理;③同一受试对象接受(一种)处理前后,这种情形在设计上存在缺陷。其检验公式构造如下:
d为每对数据的差值, �¯ 为差值的样本均数, �� 为差值的标准差, ��¯ 为差值样本均数的标准误,n为对子数。
得到t值后,查表得到对应p值,p>0.05时,不拒绝原假设,认为两组数据差异无统计学意义。
2、软件操作
使用SPSSAU进行配对样本t检验,选择【配对t检验】,将“哥特里-罗紫法”放入右侧配对1框中,将“脂肪酸水解法”放入配对2框中,操作如下图6:
图6
3、结果解读
SPSSAU输出配对样本t检验分析结果如下图:
图7
图8
从图7分析结果可知,利用配对样本t检验研究哥特里-罗紫法和脂肪酸水解法对对乳酸饮料中脂肪含量测定结果的差异性,得到p<0.01,拒绝原假设,接受备择假设,差异具有统计学意义,所以可以认为两种方法对脂肪含量的测定结果不同。
图8输出配对样本t检验深入分析指标,可以知道,两种方法测定结果的差值为0.2724±0.1087,差值的95%CI为0.1947~0.3501。同时输出Cohen's d值为2.5064>0.8,说明两种方法测得乳酸饮料中脂肪含量的差异幅度很大。
效应量说明:如果显示呈现出显著性差异(p<0.05),可通过平均值对比具体差异,同时还可使用效应量(Effect size)研究差异幅度情况;Cohen's d 值计算公式为差值的绝对值/标准差。
使用Cohen's d 值表示效应量大小(差异幅度大小),该值越大说明差异越大;配对样本t检验使用Cohen's d 值表示效应量大小时, 效应量小、中、大的区分临界点分别是: 0.20、0.50和0.80。
四、结论
本研究采用配对样本t检验研究哥特里-罗紫法和脂肪酸水解法对对乳酸饮料中脂肪含量测定结果是否存在差异。案例满足变量为定量数据;分组变量包括两类,且为配对设计。通过SPSSAU进行箱线图分析,发现差值d不存在异常值,且通过正态性检验,可以进行配对样本t检验进行差异分析。
研究结果显示,哥特里-罗紫法测得乳酸饮料中脂肪含量为0.7952±0.1844,脂肪酸水解法测得脂肪含量为0.5228±0.1860,哥特里-罗紫法测得结果较高,两种方法测定结果的差值为0.2724±0.1087,且差异具有统计学意义(t=7.926,p<0.01)。
五、知识小贴士
(1)配对样本t检验的两组数据不需要满足正态性吗?
配对样本t检验要求两组数据的差值满足正态性,并不需要特别检验两组数据的正态性。
(2)什么样的数据属于配对设计?
在医学科研中,配对设计主要有以下情形:
①两同质受试对象配成对子分别接受两种不同的处理;
②同一受试对象(如同一血液样本)分别接受两种不同处理;
③同一受试对象接受(一种)处理前后,这种情形在设计上存在缺陷。这类设计,严格来说并不属于配对设计,而是属于处理前后的重复测量设计,但也可以使用配对样本t检验分析。
参考文献:
[1]孙振球,徐勇勇.医学统计学.第4版[M].人民卫生出版社,2014
[2]颜红,徐勇勇.医学统计学.第3版[M].人民卫生出版社,2015