摘要:
今天来学习下R中字符串处理操作,主要是stringr包中的字符串处理函数的用法。先导入stringr包,library(stringr),require(stringr),或者stringr::函数名;这几种方式都行。一、检测是否匹配我们先定义一个字符串和变量,在此基础上演示各个函数基本用法。 1 library(stringr) 2 animal<-c("cow","dog","sheep"... 阅读全文
摘要:
这里记录两种perl数组去重的办法,一种利用哈希(hash),一种直接利用perl自带的模块List::MoreUtils内部的函数uniq。一、利用hash去重示例代码如下: 1 #!/usr/bin/perl -w 2 use strict; 3 4 my @list=qw /1 2 3 2 1 4 aa a bb c b bb d/; 5 foreach (@list){pri... 阅读全文
摘要:
在linxu平台下少不了对变量名的处理,今天记录下shell中 ##%% 对变量名的操作。 #操作左侧,%操作右侧。 #号处理方式: 对于单个#,处理对象为变量中指定的第一个符号左侧字符串, 对于两个##,处理对象为变量中指定的最后一个符号左侧字符串。 %号处理方式: 对于单个%,操作对象是变量中指 阅读全文
摘要:
做群体变异检测后,通常会有提取子集的操作,之前没有发现bcftools有这个功能,都是自己写脚本操作,数据量一上来,速度真的是让人无语凝噎。这里记录下提取子vcf文件的用法,软件版本:bcftools-1.5 一、根据个体提取子集 根据样品名提取vcf文件,准备要保留的个体名文件 keep.list 阅读全文
摘要:
今天有个统计需求,需要对应的元素的列求和,文件示例如下: 1 ID1 0 2 7 2 ID2 1 5 6 3 ID3 2 2 6 4 ID4 1 6 0 5 ID2 3 8 3 6 ID2 0 8 3 7 ID4 2 2 9 8 ID2 3 7 7 9 ID1 1 5 3 10 ID2 2 3 7 阅读全文
摘要:
有个瑕疵,某一块儿比例过小时,文字会重叠。 1 def pizza(data,labs,title): 2 import matplotlib 3 import matplotlib.pyplot as plt 4 cols=[col for col in matplotlib.colors.TAB 阅读全文
摘要:
图例: 1 theme(legend.title =element_blank()) 2 guides(fill = guide_legend(title = NULL)) # 去掉图例title 3 guides(fill = guide_legend(title = NULL,keywidth 阅读全文
摘要:
查了下资料,常见两种办法,一是设置行号,再者是利用python自带的itertools工具。 这里推荐一种新的方法,直接使用readline()函数就搞定。 示例: 创建一个文本文件,内容如下: 1 第1行 ID1 2 第2行 ID2 3 第3行 ID3 4 第4行 ID4 5 第5行 ID5 6 阅读全文
摘要:
做数据比较的时候,由于同一个样本测序数据量不一致,需要抽取数据,控制数据量基本一致。 自己写脚本速度较慢,后面发现一个不错的工具:seqtk 原始数据抽取 如果只控制原始数据量一致,过滤低质量数据后直接使用seqtk (Version: 1.3-r106) 的子模块seq, 配合参数 -s 设定随机 阅读全文
摘要:
一、安装 我的数据库安装的是win版本,安装python后,直接命令行: 1 pip install mycli 即可。 二、使用 进入命令行后输入: 1 mycli -u root -p 888888 效果见下图 阅读全文