生物医疗大数据-DNA element functions and identification
Genetic vs epigenetic
GENETICS 遗传学
DNA Code: 64 triplets of nucleotides encode for 20 amino acids and 3 stop codons.
EPIGENETICS 表观遗传学
RNA Code: Non-coding RNA, miRNA, Alternative Splicing
CpG Code: DNA Methylation
Histone Code: Histone Modifications, Histone Variants
Nucleosome Code: Collocation of Nucleosomes
HSs Code: Profile of DNase I Hypersensitive Sites
Trans Code: Binding and Interaction Profiles of TFs
Cis Code: Distributions & Colocalizations of Regulatory Motifs
Allele Code: Imprinting, same exact gene may act differently depending on whether they are inherited from the paternal or maternal parent
DNA methylation DNA甲基化,多位于CpG岛。
甲基化升高,p53降低,则易患肿瘤。
基因组印记取决于父源或母源。比如,甲基化印记没有正常写入,导致生长发育不能正常完成。
Reversible chemical modification that regulate the flow(DNA-RNA-protein)
一组两个酶:eg:甲基化酶,脱甲基化酶
核小体的结构,DNA缠绕在组蛋白上,缠绕DNA长度基本恒定,但是核小体在疾病状态下变小,所以关键是测量DNA长度。
核小体定位在凝胶电泳上使用射性自显影技术,当显影梯状,则证明核小体分离开。
定位之后,找DNA的高敏感位点,这段位点包含200kb,常见的突变是裸露、核小体缺失和低甲基化。
红细胞具有稳定四连体,这帮助它完成携氧。由血红蛋白、血红素和铁离子构成。
珠蛋白每个发育时期有开放gene和silicone gene表达也不一样,所以常作为转录组模型。
Transcription factors and co-factors又称反式转录原件。与之相对的是顺时转录原件,位于gene上游,是与调控gene在同一条染色体上的序列。在转录过程中会变化,富集后转录成环。
真核基因转录调控是远端promoter近端enhancer,同时转录因子富集,成环。将多个转录过程组合可以得到transcription factory:
现在提出了转录组学。
组蛋白末端修饰PTM繁多,所以提出组蛋白密码,各密码之间区分的方式是位置和修饰方式。
Chromosome conformation染色体三维结构 也会影响表型。
Sequence技术
二代sequence最开始“油包水+焦磷酸测序”技术,Illumina改进在固相载体上
AB:四色荧光,因为一个序列读两次,所以准确性高。现在转向医疗,是中国临床使用的二代测序。
三代代表性是pacbio,特点是滚环式测序,产出单分子长片段。
全基因组是全局测序,靶向测序是根据研究内容局部测序。