摘要:
每过一段时间就要读一遍,看看自己现在到底在哪个等级了。 前几天去南京参加两年一度的全国大会CCBSB2014,今年是第六届,见到许多熟识的前辈和老朋友,也结识了不少新朋友。相比于两年前在哈尔滨开的第五届大会,参会人数又多了100多。连大会特邀报告算上,总共76位学者做口头报告,其中30位学者我之前并 阅读全文
摘要:
就是指唯一比对的reads 现在人们已经开始避免使用unique mapped reads这个概念了,而转向使用mapq值来保留高质量的比对结果。因为mapq值反应了一组比对结果发生的可能性,MapQ = -10 log10(P), 比如结果为10,那就是1/10的概率会出现这个比对结果,如果我们认为0.05%是一个小概率的话,那个mapq值为15就可以用于筛选了, 如果认为0.01%是个小概率... 阅读全文
摘要:
你能给别人讲清楚这个概念吗? 二代测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。碱基的质量值13,错误率为5%,20的错误率为1%,30的错误率为0.1%。行业中Q20与Q30则表示质量值≧20或30的碱基所占百分比。例如一共测了1G的数据量,其中有0.9G的碱基质量值大于或等于20,那么Q20则为90%。 Q20值是指的测序过程碱基识别(Base... 阅读全文
摘要:
这是我们论坛上的一个题目:生信编程直播第一题:人类基因组的外显子区域到底有多... 外显子组的序列仅占全基因组序列的1%左右,但大多数与疾病相关的变异位于外显子区。通过外显子组测序可鉴定约8万个变异,全基因组测序可鉴定300万个变异,因此与全基因组测序相比,外显子组测序不仅费用较低,数据阐释也更为简单。外显子组测序技术以其经济有效的优势广泛应用于孟德尔遗传病、罕见综合征及复杂疾病的研... 阅读全文
摘要:
consensus sequence:称为一致序列。一些遗传元件(如启动子)中反复出现且很少有改变的DNA序列。不同种生物编码同一种蛋白质的基因也会有共有序列。通过序列比较发现相似但不一定完全相同的核苷酸序列或氨基酸序列。 consensus 的意思很多,接下来还会总结。 阅读全文