随笔 - 9  文章 - 1  评论 - 1  阅读 - 5391 

引用内容是我的碎碎念
封校了很无聊,想起来可以有时间继续写统计内容了。2022年了学校的医学统计仍然是用SPSS,R语言哭晕在厕所。
以下为看这本书的时候做的一些笔记,这本书编排合理,有SPSS说明,好评

参考书籍:1.Peat, J. K. & Barton, B. Medical statistics: a guide to SPSS, data analysis, and critical appraisal. (John Wiley & Sons Inc, 2014).

SPSS是菜单式统计分析软件,操作逻辑靠鼠标点击就能完成,不需要编程基础。其中DATA一栏负责分割数据、去重等等,TRANSFORM一栏负责对变量的转换、分组等,ANALYZE一栏负责各种统计分析。

数据录入界面为表格式,和EXCEL相同,在录入数据前需要在变量编辑界面设定好变量类型、取值精度等等。对每一个变量可以设置标签,这一点倒是和STATA相似,避免忘掉当初为什么这样起名。

变量的类型分为三种:

  1. Nominal Variable 名义变量,分类变量的一种,例如性别
  2. Ordinal Variable 定序变量,分类变量的一种,例如压力程度,由轻到重渐进编号
  3. Scale Variable 连续变量,即不能分类的,形式为数值的测量量,例如BMI

数据导入:常常用EXCEL进行数据录入,然后File →Open →Data导入数据进入SPSS,SPSS保存文件的后缀为sav;

但实际上最好最好不要用EXCEL做这件事,因为EXCEL有数据更正的功能,特别是当你输入基因名的时候他会自动纠正,给你的分析带来不可预知的灾难性后果。这就是生物信息分析使用编程语言的原因。

分析模型中的变量名称问题 数学里常常把X轴上的称为自变量,Y轴上的称为因变量;但是目前把他们一组叫做解释变量 Explanatory Variable,一组叫做结果变量 Outcome Variable 比较好,更符合叙述逻辑。

假设检验和P值 假设检验分为三个步骤:建立假设-计算-得出检验结论。第一个步骤中建立零假设H0,含义为要比较的几组数据之间的某个统计量,比如均值,如果均值相等,就推断没有差异。计算由统计软件完成,不用自己费心。P值代表零假设成立的概率,P值小于0.05则拒绝零假设,说明组间有差异。至于这个数字为啥是0.05,这是人为规定的,P的界限可大可小,也可以是0.1或0.01.

也正因为P值是个概率,才会有I类和II类错误的出现。I类错误为假阳性,临床中可表现为检验单上阳性但实际上病人没有临床表现,也就是零假设被错误地拒绝了;II类为假阴性,可以理解成核酸漏检了一个阳性… 详细说明可见这个解释

P值最先是由Fisher他老人家制定的,大佬发话于是就一直延续这个传统了
另据八卦,Fisher和Neyman经常就因果推断的问题进行学术争论(吵架)

关于自由度df 自由度代表有多少个变量可以自由变动,自由意味着样本的独立性。当有约束条件时(比如样本服从整体的情况下,样本均值确定了),自由度减少。
自由度计算公式:自由度=样本个数-样本数据受约束条件的个数,即df=n-k(df自由度,n样本个数,k约束条件个数)
具体请看:这个解释

关于正态性检验 除了可以用上课讲的Explore一栏在Plot选项卡内勾选检验正态性,还可以在非参数检验中进行单样本的正态检验,菜单选择顺序为Non-parametric tests; One sample; Kolmogorov–Smirnov (即KS检验)

统计方法选择 本书的1.6 Choosing the correct statistical test 对于如何选择合适的统计检验方法做了详尽的表格,考试的时候背着这个表格就不会选错了。

由于不少期刊要求同时上传原始数据文件,所以正式分析数据时要记录好存储时间和文件、原始数据相应位置。最好有单独的LOG文件记录每次的操作,避免丢失进度。

我觉得SPSS最烦人的是每次操作完成后都要跳出OUTPUT框,还很大一个。你安安静静待在后台不好吗……

缺失值的处理 Transform −→Replace Missing Values 缺失值的填补有很多种办法,最常见的是填上其他数据的均值,但这个方法其实不是很靠谱,因为这就强化了统计结论的可靠度了。

结果的保存 不需要直接用微信或其他截图,在OUTPUT界面右击结果,选择保存为图片即可。此外OUTPUT界面有按钮可以追溯先前的历史操作,也就是说,这个窗口每次点最小化而不是关掉,就能保存一次分析的所有结果。

但依旧,每次操作后都要弹窗……

就酱,有问题请在评论区留言,最近会勤快更新的。

posted on   bathcor  阅读(590)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示