生物医学大数据
Methyl-SeqDNA的甲基化图谱
DNase I-Seq全基因组染色质DNA的开放程度、非基因编码区的调控元件的分布
DNase I高敏感位点:基因处于转录活性状态时,其染色质结构处于相对松散的状态,DNaseⅠ易于接触到染色体DNA,这个区域的DNA对DNase I敏感性就比无转录活性的区域高
eg:小鼠和human比对有同源性,OR gene family
DNase I图谱技术
传统方法:Southern blot
细胞核提取--核酸酶提取---富集--识别
Southern blot用于定位DNA片段在基因组上的位置,先设计探针&酶,然后跑电泳。
基因芯片,亲和素和生物素富集方法,然后用糖沉淀。
Approach for High-resolution Mapping of Accessible Chromatin in Human Cells Using DNase-sequencing.可以得到连续的图谱。
胚胎肝细胞ES cell的HSs gene的表达情况。
高表达被认为是酶高敏感区(富集转录因子or识别增强子位点),其中157号成环。
GM是免疫细胞模型,K562是红细胞模型。
如果是某类型细胞特异性研究,要有对照试验,eg两种细胞对比(红细胞vs肝细胞)
使用bioinformatics software识别转录位点,eg:blast
验证:
实验技术验证
In vitro:电泳迁移率变动分析 (EMSA)加入蛋白质抗体可以形成super条带,这是跑最慢的条带,人工可选择研究的转录因子。
In vivo:染色质免疫沉淀 (ChIP)
生物信息验证方法egTF富集网络:
研究转录调控进化可以与其他物种相比。
ChIP-Seq重要转录因子以及组蛋白在染色质DNA上的结合、分布状态
染色质结构:
荧光原位杂交FISH来标记基因,eg:看两个基因是否有相互作用,把这两个基因分别标记为红色和绿色,就可以看红色与绿色荧光是否相互靠近。
3C-Seq染色质的空间结构
染色质构象捕获技术用于研究基因的不同状态,因为gene刚开始silence后来动态变化。
3c甲醛交联---酶切破碎---DNA重连(人工重连,确认片段来自基因组的某个位置)
ECOP5I酶可以确定上游25bpor下游27bp,高效。
3C-4C-5C-6C--,结合之前的技术得到hi-C
染色质高级结构
基于3C技术展现的三维基因组的层次结构
包括染色质领域 (chromosome territories, CT)、A/B区块(compartment)、拓扑关联结构域 (TAD, ~100-1000Kb)
TAD由绝缘区域 (Insulated Neighborhood, IN, ~200Kb)和染色质环 (~10-500Kb)组成
增强子-启动子相互作用环和活性染色质中心 (ACH) 被限制在IN内
mRNA-Seq以细胞为单元的转录本、重要转录因子和信号转导分子的表达水平
ncRNA-Seq非编码RNA的表达水平