上一页 1 2 3 4 5 6 7 ··· 13 下一页

2022年2月26日

R glimpse比较全的查看列,但看不到rownames

摘要: R glimpse比较全的查看列,但看不到rownames。 rownames 可以通过View() 或head() 如glimpse(mtcars) View(mtcars) rownames(mtcars) head(mtcars) 阅读全文

posted @ 2022-02-26 16:13 BioinformaticsMaster 阅读(70) 评论(0) 推荐(0) 编辑

2022年2月25日

lm() 拟合线性模型linear module

摘要: lm() 拟合线性模型linear module ,用来进行回归、single stratum方差分析,协方差分析 lm(formula,data,subset,weights,na.action,【other args】) lm(y ~ x,data) 这样是最常见设置的参数 如lm(formul 阅读全文

posted @ 2022-02-25 13:00 BioinformaticsMaster 阅读(904) 评论(0) 推荐(0) 编辑

2022年2月23日

YuLabSMU 截断部分坐标轴 留些空白

摘要: library(ggplot2) library(ggbreak) set.seed(2019-01-19) rnorm(5) rnorm(5)+4 d<-data.frame(x=1:20,y=c(rnorm(5)+4,rnorm(5)+20,rnorm(5)+5,rnorm(5)+22)) p1 阅读全文

posted @ 2022-02-23 21:33 BioinformaticsMaster 阅读(311) 评论(0) 推荐(0) 编辑

GPL 与BSDlicense

摘要: GPL license 核心含义:允许任何人观看、修改,并散播程序软件中的原始程序码,条件是你要发布修改后的版本就要公布源代码。 与GPL常相对的BSD license :你可以对软件任意处理,只要注明来自于哪个项目即可。即使你对软件做了修改,你也可以限制其他使用者得到你修改后软件的自由。不保证软件 阅读全文

posted @ 2022-02-23 19:19 BioinformaticsMaster 阅读(54) 评论(0) 推荐(0) 编辑

2022年2月19日

geom_boxplot 箱线图

摘要: ggplot(data=data1,mapping = aes(x=VARIANT_TYPE,y=NON_REF_GENOTYPE_CONCORDANCE))+geom_boxplot()+scale_y_continuous(expand=c(0,0),breaks = c(0,75,0.80,0 阅读全文

posted @ 2022-02-19 11:14 BioinformaticsMaster 阅读(361) 评论(0) 推荐(0) 编辑

2022年2月18日

按分组,每个组画图 

摘要: data %>%group_by(VARIANT_TYPE) %>%do({ p<-ggplot(.,aes(x=TRUTH_SAMPLE,y=NON_REF_GENOTYPE_CONCORDANCE))+geom_point() ggsave(p,filename = paste0(unique( 阅读全文

posted @ 2022-02-18 16:05 BioinformaticsMaster 阅读(32) 评论(0) 推荐(0) 编辑

R 遍历目录下所有子目录中的某类文件

摘要: testvcfdir="/jdfssz1/ST_HEALTH/P18Z10200N0124/qdNB/" testvcfList <- list.files(testvcfdir, pattern = "*.genotype.vcf.gz$", include.dirs = FALSE, full. 阅读全文

posted @ 2022-02-18 14:00 BioinformaticsMaster 阅读(112) 评论(0) 推荐(0) 编辑

2022年2月17日

faidx提取fasta指定位置allele

摘要: 提取指定区域的fasta 提取序列: samtools faidx input.fa chr1 > chr1.fa samtools faidx input.fa chr1:100-200 > chr1.fa 例子, samtools faidx /hwfssz1/BIGDATA_COMPUTING 阅读全文

posted @ 2022-02-17 16:36 BioinformaticsMaster 阅读(189) 评论(0) 推荐(0) 编辑

GATK GenotypeConcordance 比较vcf一致性:Sequence dictionaries are not the same size

摘要: 处理多份vcf时,报GATK GenotypeConcordance:Sequence dictionaries are not the same size 解决方案:统一header中的##contig=<ID= 部分 注: 1)脚本如下 gatk --java-options -Xmx3G Ge 阅读全文

posted @ 2022-02-17 15:48 BioinformaticsMaster 阅读(245) 评论(0) 推荐(0) 编辑

R 定义函数 ,里面嵌套条件

摘要: myfunction<-function(arg1,arg2,...){ statements return (object) } 例1 function1<-function(x,y){plot(x,y) + return(x+y)}x<-rnorm(10)xy<-rnorm(10,2,3) fu 阅读全文

posted @ 2022-02-17 15:35 BioinformaticsMaster 阅读(86) 评论(0) 推荐(0) 编辑

2022年2月16日

geom_point 散点分布图 配色

摘要: 1. GATK GenotypeConcordance p<-ggplot(data=data1,mapping=aes(x = TRUTH_SAMPLE,y=NON_REF_GENOTYPE_CONCORDANCE,colour=VARIANT_TYPE,shape=VARIANT_TYPE )) 阅读全文

posted @ 2022-02-16 20:50 BioinformaticsMaster 阅读(854) 评论(0) 推荐(0) 编辑

2022年2月14日

读,掌握别人项目代码 是非常好的学习路径

摘要: 读,掌握别人项目代码 是非常好的学习路径 尤其是和自己相关的项目代码。 阅读全文

posted @ 2022-02-14 20:50 BioinformaticsMaster 阅读(22) 评论(0) 推荐(0) 编辑

2022年2月11日

list.files() list.dirs()

摘要: list.files("./",pattern = "*.R$",include.dirs = TRUE,full.names = TRUE,recursive = TRUE) pattern 正则表达式,仅list匹配上的 recursive=TRUE 遍历子目录 full.names=TRUE 阅读全文

posted @ 2022-02-11 13:03 BioinformaticsMaster 阅读(335) 评论(0) 推荐(0) 编辑

Rstudio 使用

摘要: Rstudio script 运行单行/多行代码 选择多行代码,按下 Ctrl/command + Enter 键(或使用 Source 窗口标题栏上的 Run 按钮)。 在运行完某一段代码后,按下 Ctrl + Shift + P 键(或对应的标题栏按钮),即可重新运行上一次运行的代码段(单行或多 阅读全文

posted @ 2022-02-11 11:52 BioinformaticsMaster 阅读(573) 评论(0) 推荐(0) 编辑

2022年2月10日

按_1 _2 排序fqlist 递归去空格

摘要: # -*- coding: utf-8 -*- # @Time : 2022/2/10 上午10:08 # @Author : lizhichao # @Email : 13652030758@163.com # @File : sort_Fqfile.py # @Software: PyCharm 阅读全文

posted @ 2022-02-10 11:51 BioinformaticsMaster 阅读(22) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 ··· 13 下一页

导航