生命组学
密码子使用偏向性是指同义密码子使用频率不同。
影响因素:1.GC2.横向基因转移3.selection
转录偏好于多的tRNA。
同种氨基酸但有密码子使用偏向。
======================
发现密码子偏性的方法:
- 参考序列方法reference-based measure
CAI:从0到1,0就是偏向性最小,1就是偏向性最大。
Fop
RSCU
E(g)
问题:1.参考集定义不清楚
- Distribution-based measure
Nc
Nc’:bias程度max:20,min:61
CBI
卡方分析
===================
整个GC含量一致的情况下,在密码子的不同位置(3个位置)的GC含量都不同。
========================
该应用存在的问题:
没有考虑背景核酸组分
没有显著性判断
=====================
CDC=1-cos()最后通过显著性检验来看偏性是否显著。
CDC在不同物种中的分布,找到CDC最高的,发现p-value值较小的都是线粒体中的gene。
======================
未来趋势的一些案例:
将gene分为young and old
同义替换和非同义替换
将gene特性与codon usage bias相关
==============================
HK 的EIG和EVG的表达量更多,选择性更强。
15个GC-ending,第三位不是G就是C
有dnaE2的gene就是高GC 的gene,于是就发现了dnaE2。
===================================
最好做宏观分析
放在种群里面,发现陆地菌的dnaE2的含量很高,dnaE2可以作为陆地菌的标志物,有dnaE2的菌的genome size比较大。
进化假说图 :
============================
Summary dnaE family
===============================
Pangenome:core genome+dispensable genome+strain-specific genome