卡方检验 | 富集分析 | Chi-Square Test in R

基本10分以上的paper都要求有严格地统计分析,所以看起来才会professional。

 

本质就是两个离散变量的关联分析,还可以给出OR。

  • 小样本就用Fisher's exact test for small cell sizes
  • 大样本就用Chi-Square Test

 

首先画一个2X2的表格

  H1 non-H1
H2 a b
non-H2 c d

 

首先就可以算一个OR,就是比例的比例 = a * d / b *c = (a/b) / (c/d),越接近1就越代表没有区别,即没有关联(两个变量随机)。

 

其次可以用R来算P-value

1
2
3
4
tmp.table <- matrix(data = c(66,76,7,197), byrow = F, nrow = 2)
 
colnames(tmp.table) <- c("core6", "others")
rownames(tmp.table) <- c("WES", "non-WES")
1
2
3
core6   others
WES 66  7
non-WES 76  197

  

1
epitools::oddsratio(tmp.table, method = "wald")

  

结果:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
$data
A matrix: 3 × 3 of type dbl
core6   others  Total
WES 66  7   73
non-WES 76  197 273
Total   142 204 346
 
$measure
A matrix: 2 × 3 of type dbl
estimate    lower   upper
WES 1.00000 NA  NA
non-WES 24.43985    10.7338 55.64725
 
$p.value
A matrix: 2 × 3 of type dbl
midp.exact  fisher.exact    chi.square
WES NA  NA  NA
non-WES 0   5.143003e-23    4.732414e-22

  

参考:

Contingency analysis: R code for Chapter 9 examples

 

 

  

 

posted @   Life·Intelligence  阅读(551)  评论(0编辑  收藏  举报
(评论功能已被禁用)
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
TOP
点击右上角即可分享
微信分享提示