11 2019 档案
摘要:做群体变异检测后,通常会有提取子集的操作,之前没有发现bcftools有这个功能,都是自己写脚本操作,数据量一上来,速度真的是让人无语凝噎。这里记录下提取子vcf文件的用法,软件版本:bcftools-1.5 一、根据个体提取子集 根据样品名提取vcf文件,准备要保留的个体名文件 keep.list
阅读全文
摘要:今天有个统计需求,需要对应的元素的列求和,文件示例如下: 1 ID1 0 2 7 2 ID2 1 5 6 3 ID3 2 2 6 4 ID4 1 6 0 5 ID2 3 8 3 6 ID2 0 8 3 7 ID4 2 2 9 8 ID2 3 7 7 9 ID1 1 5 3 10 ID2 2 3 7
阅读全文
摘要:有个瑕疵,某一块儿比例过小时,文字会重叠。 1 def pizza(data,labs,title): 2 import matplotlib 3 import matplotlib.pyplot as plt 4 cols=[col for col in matplotlib.colors.TAB
阅读全文
摘要:图例: 1 theme(legend.title =element_blank()) 2 guides(fill = guide_legend(title = NULL)) # 去掉图例title 3 guides(fill = guide_legend(title = NULL,keywidth
阅读全文
摘要:查了下资料,常见两种办法,一是设置行号,再者是利用python自带的itertools工具。 这里推荐一种新的方法,直接使用readline()函数就搞定。 示例: 创建一个文本文件,内容如下: 1 第1行 ID1 2 第2行 ID2 3 第3行 ID3 4 第4行 ID4 5 第5行 ID5 6
阅读全文
摘要:做数据比较的时候,由于同一个样本测序数据量不一致,需要抽取数据,控制数据量基本一致。 自己写脚本速度较慢,后面发现一个不错的工具:seqtk 原始数据抽取 如果只控制原始数据量一致,过滤低质量数据后直接使用seqtk (Version: 1.3-r106) 的子模块seq, 配合参数 -s 设定随机
阅读全文
摘要:一、安装 我的数据库安装的是win版本,安装python后,直接命令行: 1 pip install mycli 即可。 二、使用 进入命令行后输入: 1 mycli -u root -p 888888 效果见下图
阅读全文
摘要:今天在用R作图的时候发现配色不好看,在网上找到两个不错的取色网站,各有特色,推荐给有需要的人。 http://link.fobshanghai.com/rgbcolor.htm https://colorhunt.co/ http://www.peise.net/tools/web/
阅读全文
摘要:直接使用os模块的popen打开 import sys import os a=os.popen('/Soft/samtools-1.2/samtools flags '+sys.argv[1] ,'r') print(a.read())
阅读全文