日常paper阅读记录

都有哪些玩家?

  • 某个生物学方向(发育、免疫、癌症)的大佬,强在领域的深耕,先进的技术平台,能产生高质量的data,第一作者和通讯一般都是搞实验的,生信最多也就是个共一,文章容易冲击CNS。【掌握实验材料、临床样本、测序数据】
  • 某个疾病(depression、SLE、HSCR)的遗传学家,主要就是借助genomics的技术来找疾病的variants和genes,以技术为主,文章不容易发大,除非data够大。
  • 大型Atlas合作项目,基本就是烧钱,作铺垫性的工作,短期内很难看到成效,文章基本能发到CNS。
  • 开发算法、模型和数据库的计算生物学家,针对前沿的数据(scRNA-seq,image data)和问题(pleiotropy),提出特定的解决方案,文章也不容易发大,以统计和算法为主。

 

 


2023年04月10日

点评SR paper: Histone deacetylase (HDAC) 1 and 2 complexes regulate both histone acetylation and crotonylation in vivo

优点:

1. 思考的深度是有的,乍一看,甚至还感觉到了有点novel;

2. 有些图做得还挺好看的,尤其是Figure 4,我都有点想模仿;

缺点:

1. 全程不提disease,作者完全不懂现在的biomed的研究逻辑,必须分子+疾病关联起手,否则就是垃圾;而且工作量太少,就四个section,怎么也要7个左右;

2. 可以在众多cancer中筛选出,该机制发挥重要作用的sub-disease,而且必须用多个model来确认;【实在没实验,那就多搞些公共数据】

3. 然后再深入机制,这篇文章完全跟disease脱钩,机制也没啥本质创新,研究技术方法也不新颖,所以SR就是你的归宿;

4. 有条件就加入drug的分析,如果能correct disease表型,那基本就是10+的文章,做好一点就是cancer四大神刊任君投;

 


 

2023年01月27日

点评SR Paper:SOX9 promotes tumor progression through the axis BMI1-p21CIP
优点:
1. 核心的都有了,但都不够,让人觉得十分可惜;
2. 起手就是Sox9敲除,用的shRNA,有点过时了;过表达也做了;
3. 其次,model太简单,只有cell line是远远不够的,必须引入相应的cancer model,以及organoid;
4. 基本的表型检测都有;没有NGS,也没有单细胞,就是WB做了两个目标基因,这是不可取的;
5. 临床数据也有,但同样太简单,就是一个关联,这个section也就配做一个sub-figure;
6. rescue实验也做了,但model太简单

如果这篇Paper能把approach彻底提升一下,发在10分以上的杂志完全没问题。
1. 加入mouse model和organoid model;
2. 加入single-cell,ST,cut&run;
3. 对机制的描述更加深入一点;

反思:
1. 其实Elly和Nialy都算是搬砖灌水的,只是拿到钱了,敢追新,舍得花钱;
2. 本质上没有任何创新,方法没有,结果没有,理论也没有;
3. 你博后出站了能做到什么地步呢?

 

 

 

信息

这部分我比较擅长,逻辑明确,不存在什么歧义。

 

调控variants的功能研究

2015 - PNAS - Multiple functional variants in long-range enhancer elements contribute to the risk of SNP rs965513 in thyroid cancer

GWAS的non-coding variant入手(靶向测序) - haplotype和LD找邻近的enhancer variant(类似fine mapping) - 对基因表达的影响 - 公共数据挖掘邻近enhancers,靶向测序验证 - Allele-Specific Enhancer Activities - differential occupancy of TF - chromosome conformation capture (3C) assay来看Physical Interaction

简评:GWAS下游的典型分析,找到了lead SNP,再找causal SNP,做得很细。haplotype分析缩小目标区域;公共数据库挖掘确定目标enhancer,靶向测序验证;多角度阐述,allele specific enhancer活性;TF差异的occupancy;最后3C直接串联,解释了本质的eQTL。整篇工作非常扎实,策略得当,省了不少钱和工作量,可以套路化(pipeline),值得后人借鉴。【通篇逻辑非常明确,基本都是genomics和genetics的分析,以技术为主】

 

2020 - NAR - Functional effects of variation in transcription factor binding highlight long-range gene regulation by epromoters【DNA顺式调控元件,CRMs Atlas,1300 CRM variants】

allelic associations with gene expression(就是eQTL,一个非常好的串联上下游的工具)

把我的一个想法给做了,就是找那些在enhancer里面的variants,从而影响了gene expression。

是你怎么做?需要预测一个variant是否会显著改变motif的binding,结合capture-Hic来看这些predicted的variant 是否会改变gene expression,这不就完了吗?有什么问题?

别人是怎么做的?【我靠,一步就能搞定,做了这么多工作,扎实。挖public data真难,NAR不好灌水啊】

  • 公共ChIP-seq narrow peak files,定义CRM区域
  • 1000 Genomes Project找在CRM区域的variants,分析TF binding affinity
  • DeepSea预测variant对TF binding的影响,与前面的做比较
  • DNase I sensitivity QTL,variant还能影响表观状态(这也是DeepSea的假设),就是allelic associated DHS signal 【参考原始paper
  • ATAC-QTLs
  • massively-parallel reporter assays (MPRA) 辅佐验证
  • PCHi-C data
  • Gene expression
  • Association testing ( threshold-free)
  • eQTL fine mapping
  • Causal variant colocalization

 

预印版 - Trans-ethnic eQTL meta-analysis of human brain reveals regulatory architecture and candidate causal variants for brain-related traits【eQTL的meta analysis】

 

2021 - GB - The genetic mechanism of heterosis utilization in maize improvement 【杂种优势原理探讨,严建兵】

 

 


 

生物

专业领域,需要很强的biology理解,什么是关键问题。生成的data完全取决于需解决的问题和所采取的的实验技术,这里的生物信息只是辅助,归根结底还是需要生物学的思维。【以故事为主,发力不当就像打海绵,使不出力,身为行外人,很难理解为什么有些研究可以发那么高分】

 

肠道神经发育生物学

2017 - Science - Lineage-dependent spatial and functional organization of the mammalian enteric nervous system【ENCC development】

fate mapping技术/genetic labeling strategy标记某个细胞的发育进程 - 单细胞转录组揭示发育的分子机制 - mosaic analysis with double markers (MADM)分析RET对ENS发育的影响 - ENS发育的Topology分析 - Coordinate activity电刺激下的神经元的协同运动

简评:借助先进的fate mapping技术来研究ENS的发育,单细胞转录组揭示分子机制,深入RET对ENS发育的影响,高级的Topology和电刺激协同性分析。因为不是该领域的资深专家,不是很理解该工作的重要性,我也就能做好这部分单细胞的数据分析,不敢妄评。

 

cancer

2021 - NC - Model-based analysis uncovers mutations altering autophagy selectivity in human cancer【薛宇,整合分析】

 

 


 

算法

 

 

 


 

数据库

2019 - NAR - GENCODE reference annotation for the human and mouse genomes

GWASdb

2020 - Briefings in Bioinformatics - CellTalkDB: a manually curated database of ligand–receptor interactions in humans and mice

2015 - NC - A draft network of ligand–receptor-mediated multicellular signalling in human 

2012 - Bioinformatics - RNA-Seq Atlas—a reference database for gene expression profiling in normal tissue by next-generation sequencing (https://www.ebi.ac.uk/gxa/home)

2019 - JMB - refTSS: A Reference Data Set for Human and Mouse Transcription Start Sites 【TSS数据库】 

 

遗传与药物

2015 - NG - The support of human genetic evidence for approved drug indications

实证了遗传学证据对临床药物成功率的关系,遗传学GWAS大有所为。

 

 

drug repositioning

 

Atlas系列

2021 - Cell - Population-scale tissue transcriptomics maps long non-coding RNAs to complex disease 【lncRNA,中文解读

 

技术类

2018 - NC - Single-cell full-length total RNA sequencing uncovers dynamics of recursive splicing and enhancer RNAs

 

转录调控

Hnisz, D. et al. Super-enhancers in the control of cell identity and disease. Cell 155, 934–947 (2013). - super-enhancers

Saint-André, V. et al. Models of human core transcriptional regulatory circuitries. Genome Res. 26, 385–396 (2016). - 提出CRCs概念

2017 - NG - Heterogeneity of neuroblastoma cell identity defined by transcriptional circuitries - 使用CRCs进行分析的案例

 

posted @ 2021-05-19 15:06  Life·Intelligence  阅读(1178)  评论(0编辑  收藏  举报
TOP