基础医学实验设计 | 控制变量法 | 调控因果推断 | 单、双基因干预实验
2023年02月02日
博士的NC文章,被怼的最厉害的就是不够causal,这也是生信起手,有实验但又不深的缺点。
所以,单基因操纵是必须得,建立单基因与phenotype的关系;
同时,双基因操纵也是必须的,阐述两个基因之间的关系;
重点关注基础医学的实验设计:GWAS、疾病的分子机理的研究。
只有reference我们能做什么?
- 以human genome为例,基本的注释、功能、互作都能做,以此为蓝图是可以重构一个human的,但这只是一个人的维度,为了维持多样性,我们必须引入各种突变,然后筛选适者;
- 理论上,我们可以借助控制变量法来一个一个的研究reference里的元件,解释其功能,有一定的指导意义,但局限性很大,现实确实非常复杂;
- 研究一个分子的局限性非常大,因为分子间有非常复杂的interaction,附加的分子有protective和incease risk的功能,conditional knock out就是一种例子,没有protective的factor都活不过早期胚胎发育
- genotype到phenotype之间是高度可变,且有多样性的;只有reference我们无法得知群体中现存的phenotype/疾病是由哪些控制的,不知道机制,也就无法找到靶点,开发靶向药物【预防、诊断、治疗都无法突破】;
- 生物信息的终极目的就是根据多组学的数据来有效的对疾病做出预防、诊断和治疗
目前主流的实验设计:
- 一切都是从现有的病人数据开始,找mutation、variant;
- 针对某个特定的对象:variant、mutation、gene,构建基础模型来研究
基础概念:
- 病人是非常复杂的实例,他们这是根据表型的观测来归类的,核心的是利用大样本的相关性把高风险的factor给鉴定出来了
- 研究单个病人是没有意义的,因为这是个个例,而且混杂的因素太多,由于伦理问题,很多invasive的实验都做不了
- 所以构建其他模型来研究病人来源的factor就是目前的绝对主流了,更容易临川转化
很多人都会怼,都什么时代了,大家都知道分子调控是一个分子网络,研究单个基因还有什么卵用。
那我们再反问一下,除了一个一个的构建model来研究,我们还有其他办法吗?我们真能根据一个病人的多组学测序数据来直接做出全面的解释吗?
No,我们对复杂系统的控制能力还非常弱,这些看似笨傻的GWAS和单基因敲出实验是我们目前唯一能熟练掌握的技术了。
GWAS的关联分析,多么elegant的筛选,直觉就能理解;
控制变量法的单基因敲除实验,探索和解释起来也能完全掌控;
我们清楚的知道,在数学中,每增加一个变量,其计算量可以说是几何倍数的增加。在我们进行许多研究的时候,都要通过整齐化制造一个对结果有利的环境。这种手段,是受限于人类的思考能力,使用的简化问题的手段。但是这是否阻挡了所谓科学的进步?有许多基于系统性的问题,有大量的因素和相互作用关系。一旦我们采用控制变量的手段,往往会导致问题本身的混乱,甚至是不可解。在一个复杂的系统中更是如此,如果只是追根溯源,采用针对问题本身的调节,又会出现连续的复杂的隐患。如此,如何判断问题?控制变量的方式本身,是否不符合世界的更复杂的问题?
生命之复杂系统:
- 生命其实与魔法无异,可以用河流来比喻吗?貌似都分为上中下游。DNA是因,后面RNA蛋白是果吗?
- 生命系统并不抽象,反而非常具体,因为一切都是一些分子实体在运作,所以因果关系非常稳固,DNA是因,它是蓝图、是指挥官;RNA是信使,传递信息;蛋白是小兵,负责功能执行;
- 多层级:分子一个层级,DNA、RNA、蛋白、代谢;细胞一个层级,每种细胞都有自己的命运;器官一个层级,行使一项非常宏大的功能;个体一个层级;群体一个层级;
- 多功能:每个层级的每个实体都有自己独特的功能,就像人类分化出来的工种一样;
猜测:
- 某项功能或表型最少需要的分子实体组合
- 多个上游的alternation converge到下游的功能差异
参考: