上一页 1 2 3 4 5 6 7 8 ··· 13 下一页

2022年2月10日

顺序的fqlist拆解成sample fqsize fq格式 ,涉及正则取样本名

摘要: # -*- coding: utf-8 -*-# @Time : 2022/1/20 下午10:10# @Author : lizhichao# @Email : 13652030758@163.com# @File : sample_fqsize_fq.py# @Software: PyCharm 阅读全文

posted @ 2022-02-10 11:49 BioinformaticsMaster 阅读(27) 评论(0) 推荐(0) 编辑

2022年2月9日

ggplot2(grammar of graphic)

摘要: ggplot2 特点 1. 采用图层的设计,利于结构化思维实现数据可视化。明确的起始 ggplot() , 图层之间叠加通过+实现 。通常geom_xx()或stat_xx()绘制一个图层 2. 把表征数据与图形细节分开,便于创造性的绘图。通过stat_xx()实现将常见的统计变换融入绘图中 3. 阅读全文

posted @ 2022-02-09 14:43 BioinformaticsMaster 阅读(126) 评论(0) 推荐(0) 编辑

2022年2月8日

想取出两列数据不同 对应的那行观测

摘要: 想取出两列数据对应不同的那行观测 ,一步实现不来如bamsex_proportion[bamsex_proportion$sex1male_2female !=bamsex_new$sex1male_2female] 只能先把比较结果赋值给新列,再取出来对应的观测, bamsex_proportio 阅读全文

posted @ 2022-02-08 19:22 BioinformaticsMaster 阅读(39) 评论(0) 推荐(0) 编辑

subset 函数 选择数据框/向量的子集

摘要: subset(数据框,条件) 按条件选择子集 Datafra<-data.frame(name=c(1,2,4,NA,4,5,7),family=c("xiao","ming",NA,NA,"zhou","zheng","li")) Datafra subset(Datafra,name>=1) s 阅读全文

posted @ 2022-02-08 19:15 BioinformaticsMaster 阅读(174) 评论(0) 推荐(0) 编辑

2022年2月7日

R 处理、可视化 多变量数据

摘要: factoextra 包 1 PCA Principal Component Analysis 2 CA Correspondence Analysis 3 MCA Multiple corespondence Analysis 4 MFA Multiple Factor Analysis 5 HM 阅读全文

posted @ 2022-02-07 13:39 BioinformaticsMaster 阅读(186) 评论(0) 推荐(0) 编辑

2022年2月4日

ggplot tools ggpubr arrange

摘要: library(ggpubr) # ggpubr 是基于ggplot2开发,更便捷,使图满足论文出版的需要。 df<-iris colnames(df)<-paste0("V",1:5) # paste0 连接符是空字符串,相比paste不能设置sep df p1<-ggplot(df,aes(x= 阅读全文

posted @ 2022-02-04 14:50 BioinformaticsMaster 阅读(129) 评论(0) 推荐(0) 编辑

2022年1月31日

R 矩阵数组

摘要: A<-matrix(11:16,nrow=3,ncol=2) # 实际按向量存储,根据保存的行数,列数对应到矩阵的元素,存储次序默认是按列存储。 B<-matrix(c(1,-1,1,1),nrow=2,ncol=2,byrow=TRUE) #设置byrow=TRUE,则按行存储 取矩阵的行数 nr 阅读全文

posted @ 2022-01-31 10:01 BioinformaticsMaster 阅读(37) 评论(0) 推荐(0) 编辑

2022年1月27日

R 列表

摘要: R 列表list 保存不同类型的数据,可提供R分析结果的包装,如输出一个包含回归系数、预测值、残差、检测结果等不规则数据结构的变量。 相比数据框,列表不要求各列等长 相比向量,列表不要求所有元素类型相同 赋值 如rec<-list(name="liming",age=30,scores=c(85,7 阅读全文

posted @ 2022-01-27 17:35 BioinformaticsMaster 阅读(90) 评论(0) 推荐(0) 编辑

uniq 搭配sort 去除重复行,查找重复行

摘要: 去除重复行 sort $file |uniq 查看重复行 sort $file|uniq -d 统计重复情况 sort $file|uniq -c 查看非重复行 sort $file|uniq -u 阅读全文

posted @ 2022-01-27 09:38 BioinformaticsMaster 阅读(65) 评论(0) 推荐(0) 编辑

2022年1月25日

rsync 本地路径到挂盘路径 ;挂盘路径到本地

摘要: 要解决的是每次都要输入密码,所以不能后台投递任务。 解决方案: 核心是expect spawn #!/usr/bin/expect -f set timeout 10 set username [lindex $argv 0] set password [lindex $argv 1] set ho 阅读全文

posted @ 2022-01-25 15:18 BioinformaticsMaster 阅读(52) 评论(0) 推荐(0) 编辑

2022年1月24日

GATK joint-calling 不需要手动设置--ploidy

摘要: A pooled experiment is different from joint calling. It means when you combined the DNA of many individuals and sequenced them together. The DNA is no 阅读全文

posted @ 2022-01-24 15:33 BioinformaticsMaster 阅读(226) 评论(0) 推荐(0) 编辑

2022年1月23日

作图与修图

摘要: 作图与修图是个手艺,需要磨 1天不行,就两天,做个好图,花费很多时间很正常 作新图 数据梳理 核心画图函数掌握 修理 在现有脚本基础上做图 拷贝到Rstudio,逐个代码块运行,调试 需要参考时可以google,键入关键词 如roc ggplot2 阅读全文

posted @ 2022-01-23 20:52 BioinformaticsMaster 阅读(56) 评论(0) 推荐(0) 编辑

2022年1月21日

linux 帐号便捷登陆

摘要: 核心 如设置便捷su #!/usr/bin/expect -f set port port_no set user st_mchri_bigdata set password Genomics20210 set timeout -1 spawn su $user expect "*assword:* 阅读全文

posted @ 2022-01-21 17:35 BioinformaticsMaster 阅读(48) 评论(0) 推荐(0) 编辑

集群.bashrc不涉及路径

摘要: 集群个人目录下的.bashrc不要涉及source/export路径,不然有些盘故障,就会影响任何形式的访问。 1. 登陆卡住 2.scp 卡住 解决方法: 涉及路径的自定义环境变量可以写在如 ~/profile.sh这样的脚本里边,在使用时在shell里边source ~/profile.sh使环 阅读全文

posted @ 2022-01-21 10:01 BioinformaticsMaster 阅读(37) 评论(0) 推荐(0) 编辑

2022年1月19日

stringR包 字符串拼接,对字符串切分 替换 匹配提取 位置提取

摘要: paste("D","CMDCB0000013","-1",sep = "") 拼接字符串,可以用于新增列non_json$DNAcode<-paste("D",non_json$Sample,"-1",sep="") ,当然搭配mutate用也一样 stringR 包对字符串切分 替换 匹配提取 阅读全文

posted @ 2022-01-19 11:00 BioinformaticsMaster 阅读(250) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 ··· 13 下一页

导航