TAD calling 之 insulation score 分析

1. 导读

本文主要对insulation score 的提出与计算方法进行简要的介绍,并展示一个计算insulation score 的过程。

2. 定义

insulation scoredekker实验室在2015年发表于Nature上的Condensin-driven remodelling of X chromosome topology during dosage compensation文章中提出的,其主要用于TAD相关的分析与表征,目前insulation score主要用于识别TAD

3. 计算方法

3.1. 计算insulation score

计算过程动画

​ 在给定的区域内,沿着互作矩阵的对角线,以一个正方形的滑动窗口,从上至下滑动,计算每个窗口内互作程度值的总和。

​ 这些bin之间存在这很强的insulation现象,例如在TAD的边界,这些区域的insulation score (根据insulation square测定)很低。

​ 那些互作程度较高,比如TAD内部的区域,它们的insulation score 很高。

​ 这些insulation score 很低的区域,可能就是潜在的TAD边界。

3.2. insulation score标准化

标准化公式

ISavg: 是所有IS值的平均值

3.3. 计算每个bindelta

insulation score 曲线

​ 将每个bin的互作强度值作为value,画出其在染色体上的波动曲线,波谷处就是需要识别的边界。为了识别出黑色曲线中的波谷,方法中又定义了一个window,对每个bin内的insulation值计算delta值,最终红色曲线中经过X轴的坐标即为insulation score值曲线的波谷,也就是TAD边界的位置(从上图可以看到,红色曲线穿过0刻度线的点,对应的就是黑色波动曲线的波谷)。

3.4. 计算TAD边界

​ 由于该方法计算的是TAD的边界位置,因此TAD domain的位置区域,需要进一步的转换,才能得到。

4. 公式总结

公式总结

5. 实战

下面介绍如何用FAN-C计算insulation score

5.1 install

pip install fanc -i https://pypi.tuna.tsinghua.edu.cn/simple
  • 推荐使用conda进行安装
conda create -n fanc python=3.7
conda activate fanc
conda install fanc

5.2. example

  • 计算

利用不同的windows size计算insulation score

fanc insulation ./example.hic ./example.insulation \
-w 1000000 1500000 2000000 2500000 3000000 3500000 4000000 \
-o bed  # 输出bed 格式
  • TAD强度变化图

TAD边界强度变化图,大体上可以反映TAD之间隔绝情况,绝缘系数越低,TAD之间交互越弱。

边界强度变化图

  • 绘图
fancplot -o ./insulation.png chr18:18mb-28mb \
-p ./example.hic -m 4000000 -vmin 0 -vmax 0.05 \
-p ./example.insulation

  • 曲线图
fancplot --width 6 -o ./example.png \
chr18:18mb-28mb -p triangular ./example.hic -m 4000000 \
-vmin 0 -vmax 0.05 -p line ./example.insulation_1mb.bed \
./example.insulation_2mb.bed -l "1mb" "2mb"

insulation score 曲线

有任何问题,欢迎大家评论区留言,或者私信小编。

本文由mdnice多平台发布

posted @ 2022-09-24 16:46  数据科学工厂  阅读(243)  评论(0编辑  收藏  举报