1. 配对样本的差异分析
在差异分析的数据处理中,只有design这一行代码有区别
1 2 | pairinfo = factor ( c (1,2,1,3,2,3)) design = model.matrix (~group_list + pairinfo) |
配对信息:1,2,3分别为三个病人;
分组信息:由group_list指定,post和pre为有序因子。
配对样本数据的可视化
2. 多个分组的数据
策略1:选出一个分组作为对照,其他分组分别与对照进行差异分析
策略2:两两对比:AB、AC、BC
关于作图:火山图只能分开画,其他图分开和合并都可以
3. 多个series联合分析
考虑批次效应:
(1)选择来自同同一芯片平台(GPL)的series
(2)需要处理批次效应(Batch effect)
数据集A + B,各自分为treat和control两组;
本来AB各自的treat和control各有差异,合并后竟然无差异
本来AB各自的treat和control无差异,合并后竟然有差异
处理批次效应
例如,合并两个数据集时,第二个数据集的第三个样本有异常:
可以用limma::normalizeBetweenArrays()函数把异常样品的中位数拉到同一水平上,也可以直接把异常样本去掉。比较来说,去掉的结果更好些。
但是,直接用两个中位数不在同一水平上的数据集来做分析的结果是错误的,需要处理批次效应,将两个数据集的中位数拉到同一水平上:
处理批次效应的两个函数:limma::removeBatchEffect(),sva::ComBat()
分类:
GEO_mRNA
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!