摘要: 在参数调优的过程中,不同个体数的样本组合需要计算,但是一个一个用for来穷尽组合的可能显得太过笨拙,查到可以用itertools中的combinations模块来处理类似的问题: from itertools import combinations from sys import argv impo 阅读全文
posted @ 2023-03-16 17:37 xjce 阅读(231) 评论(0) 推荐(0) 编辑
摘要: awk 'NR==FNR{a[$1,$2];next} !($1,$2) in a' file1 file2 阅读全文
posted @ 2022-11-08 21:34 xjce 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 参考博文:https://zhuanlan.zhihu.com/p/428316843 转载请注明出处 1. 下载安装包: nextflow可以通过bioconda安装,所以这次我们只需要下载nf-core/rnaseq的安装包即可: mamba create -n nextflow nextflo 阅读全文
posted @ 2022-03-30 14:46 xjce 阅读(1067) 评论(0) 推荐(0) 编辑
摘要: sed -e 's#\(.\)#\1\n#g' shell不同于python,不能方便地遍历字符串中的所有字符,使用上面的代码可以遍历字符串中的每个字符,最后分行输出。 通过下面这组代码就可以遍历到文件中的每个字符然后看看里面有多少个"*" for i in `ls a.txt` do cat $i 阅读全文
posted @ 2022-03-01 16:09 xjce 阅读(705) 评论(0) 推荐(0) 编辑
摘要: #! /bin/bash function read_dir(){ for file in `ls $1` #注意此处这是两个反引号,表示运行系统命令 do if [ -d $1"/"$file ] #注意此处之间一定要加上空格,否则会报错 then read_dir $1"/"$file else 阅读全文
posted @ 2022-01-05 16:43 xjce 阅读(386) 评论(0) 推荐(0) 编辑
摘要: 很多时候使用grep批量处理一些东西需要接受上一个文件的一列数据,这个时候需要通过管道传递数据方法如下: cat fileA.txt | awk '{print $1}' | xargs -i grep {} fileB.txt > result ##此处使用文件A的第一列在文件B中寻找一样的列输出 阅读全文
posted @ 2021-07-22 10:20 xjce 阅读(1909) 评论(0) 推荐(0) 编辑
摘要: awk使用shell变量1."'$var'" 单引号在里双引号在外#!/bin/bashvar="test"awk 'BEGIN{print "'$var'"}'这种写法要求变量var中不含有空格。若var中含有空格,那么就要用 “‘“$var”’” 这种写法亲测有效 2.export变量,然后用E 阅读全文
posted @ 2021-02-08 16:04 xjce 阅读(1157) 评论(0) 推荐(0) 编辑
摘要: https://gis.stackexchange.com/a/193828/66527 可以从GIS Internals下载适用于Windows的GDAL 2.1 。有一个安装程序和一个不需要安装的便携版本。 GDAL 2.1可以从UbuntuGIS-Unstable PPA下载到Ubuntu 1 阅读全文
posted @ 2019-03-25 16:54 xjce 阅读(829) 评论(0) 推荐(0) 编辑
摘要: 在处理文本文件时,很多时候需要我们处理跨行的数据,但是用for循环处理不是很方便,想了一个歪招来处理不是很大的数据。 核心思想就是将上一行的东西存在一个列表里,到下一行用完这个数据在循环体里将列表初始化,再将这行数据存到列表里,这样循环就可以把两行数据联系起来。 另外这样做的还有另外一个好处,就是可 阅读全文
posted @ 2019-03-08 09:57 xjce 阅读(1386) 评论(0) 推荐(0) 编辑
摘要: 基因组注释工具ANNOVAR是一款非常好用的注释软件,功能强大,输出数据简单美中不足就是对于非人类物种来说UI不够完善,因此总结一下整个注释的过程,帮助别人快乐自己。 首先我们需要明确我们需要的数据和软件: 数据包括: 这样就是所有的输入文件了,现在我们列举一下需要用到的软件: 有了这些我们就可开始 阅读全文
posted @ 2019-01-13 10:53 xjce 阅读(1403) 评论(0) 推荐(0) 编辑