摘要: 通过GATK calling出来的SNP如果使用UnifiedGenotype获得的SNP文件是分sample的,但是如果使用vcftools或者ANGSD则需要Vcf文件是multi-sample的,这里就需要我们将不同samples的文件进行合并,可以通过vcftools的perl模块进行,但是 阅读全文
posted @ 2018-07-13 15:07 xjce 阅读(8299) 评论(0) 推荐(0) 编辑
摘要: 大圣,此去欲何? 踏南天,碎凌霄! 若一去不回。。。 便一去不回! 便 一去不回! 阅读全文
posted @ 2018-07-13 12:33 xjce 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 只要有ENA千万别用NCBI!!!! 最近开始分析网上Download的数据,一开始用人家现成的GWAS数据,后来觉得反正自己的数据到手该做的也是要做的,出来混早晚是要还的,所以就开始从头分析一些SRA的数据,我以为会很简单,事实证明是我简单了。 首先我们下了这样的一串数据,*.sra格式: 这些数 阅读全文
posted @ 2018-07-13 12:30 xjce 阅读(2363) 评论(0) 推荐(0) 编辑
摘要: 在对vcf的操作有这样三个软件: 利用Bcftools按样本拆分文件主要利用了“--view”这个软件包,主要代码如下: 这里面三个参数: 就可以完成了。 阅读全文
posted @ 2018-07-13 10:05 xjce 阅读(4016) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 我们经常说幻想着使用已有数据发表高分文章,的确,这样的童话故事每天都在发生,但如何走出第一步我们很多小伙伴不清楚,那么我们就从水稻SNP数据库的使用来讲起。 这是3k的水稻变异库,上面保存着现成的SNP,由于数据过大,网站的维护方使用了Plink的格式来给我们在线储存SNP的信息,可以 阅读全文
posted @ 2018-07-13 09:53 xjce 阅读(2932) 评论(0) 推荐(0) 编辑