生信工具: DESeq2的原理

DESeq2步骤

DESeq2原理

2014原理论文发布在Genome Biology。

Estimate dispersion的策略:

第一步,通过极大似然估计粗略估计出各基因的 dispersion 参数。

(若包含非常多的sample 或者 repeat 数目, 这一步基本就能得到最终结果)

image-20231011154534113

第二步,对极大似然估计的结果进行拟合,得到趋势线。

image-20231011152842382

第三步,对于一些远离趋势线的点,向趋势线附近调整。

image-20231011152944766

接下来对上面三步实操:

使用DESeqDataSetFromMatrix获取DESeq2的对象后,如果需要一步获取则使用DESeq函数即可

deseq2.obj = DESeqDataSetFromMatrix(countData = count_df.filter, colData = sample_df, design = ~condition)
deseq2.obj
deseq2.obj = DESeq(deseq2.obj)

可以看到DESeq的输出为:

image-20231011154121422

分别是这么几步:

estimating size factors 做 normalization 用的 RLE 方法

estimating dispersions 通过极大似然估计各基因的 dispersion 参数

gene-wise dispersion estimates 拟合极大似然估计得到的结果,得到趋势线

mean-dispersion relationship 对于一些远离趋势线的点,向趋势线附近调整

posted @   仗剑天涯横刀笑  阅读(397)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· AI 智能体引爆开源社区「GitHub 热点速览」
点击右上角即可分享
微信分享提示