摘要:
大家基本都知道什么是 FASTA 和 FastQ 格式了,但这是不够的。 我们还需要了解世界上最大的测序公司自己定制的 FastQ 格式,因为你可能会经常用到,有时还会亲自去处理它们。 本文主题:Illumina 测序数据中的 Index Fastq格式详解 @FCHCGKFBCXY:1:1101:1110:2162#AACAGCACCTAGCA_GTAGTGCG/1 ATGTATA... 阅读全文
摘要:
今天查了一下R语言中set.seed(),该命令的作用是设定生成随机数的种子,种子是为了让结果具有重复性。如果不设定种子,生成的随机数无法重现。 > x<-rnorm(10) #随机生成10个随机数 > x [1] 0.3897943 -1.2080762 -0.3636760 -1.6266727 阅读全文
摘要:
参考: 分子生物学教材 再一次,翻看真核生物基因结构! mRNA基本结构特点 Structure and function of Messenger RNA (mRNA ) 基因结构 其实这个结构不完整,完整的如下: 主要注意UTR这个结构 真核生物的基因结构包括编码区和非编码区。 编码区 编码区其实是断裂基因结构,也就是不连续基因。具有蛋白编码... 阅读全文
摘要:
如果你的职业定位是数据分析师/计算生物学家,那么不懂PCA、t-SNE的原理就说不过去了吧。跑通软件没什么了不起的,网上那么多教程,copy一下就会。关键是要懂其数学原理,理解算法的假设,适合解决什么样的问题。 学习可以高效,但却没有捷径,你终将为自己的思维懒惰和行为懒惰买单。 PCA的原理和普通实 阅读全文
摘要:
问题: 三代基因编辑的技术特点是什么?具体机制是什么?技术起源? DSB和DSR是什么?核酸酶发挥着什么作用? CRISPR是如何在细菌中发现的?细菌是如何实现自我免疫的?有哪些关键元件?spacer DNA是什么?crDNA是什么? 理解CRISPR的每一个词是什么意思 CRISPR是如何被改造, 阅读全文