12 2017 档案

摘要:R语言是单线程的,如果数据量比较大的情况下最好用并行计算来处理数据,这样会获得运行速度倍数的提升。这里介绍一个基于Unix系统的并行程序包:multicore. 我们用三种不同的方式来进行一个简单的数据处理: 我们从 1000 genome project 数据库下载了VCF文件,现在需要手动提取出 阅读全文
posted @ 2017-12-20 19:37 生信老码农 阅读(1261) 评论(0) 推荐(0) 编辑
摘要:引用自NCBI的概念(https://www.ncbi.nlm.nih.gov/projects/SNP/docs/rs_attributes.html#gmaf) Global minor allele frequency (MAF): dbSNP is reporting the minor a 阅读全文
posted @ 2017-12-19 19:23 生信老码农 阅读(20100) 评论(0) 推荐(0) 编辑
摘要:高中学生物的时候关于遗传学的部分,记得当时的教材上为了简化处理一般将基因型定义为AA, Aa, aa。其实这种抽象的理解对应付高考是很有用的,但是实际应用中如果还这样理解那么便会产生一些疑问。之所以会产生这样的抽象,原因是早期并不知道双螺旋DNA是遗传物质,就更不提什么中心法则和DNA测序了。然而当 阅读全文
posted @ 2017-12-19 15:46 生信老码农 阅读(12807) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示