04 2021 档案

摘要:需求 客户反映,完整的基因组太大打不开,要我将之按各条染色体和scaffold拆分。如何快速实现? 方法一 借助工具: $ pip install pyfaidx $ faidx -x sequences.fa 方法二 自己写脚本:split.pl #!/usr/bin/perl $f = $ARG 阅读全文
posted @ 2021-04-28 17:05 生物信息与育种 阅读(1889) 评论(0) 推荐(0) 编辑
摘要:conda是个安装软件的神器,但镜像不稳定,下载安装软件的速度有时很慢。对于几十Mb甚至上百Mb的软件往往下不动,下了半天可能失败。 找了一个叫mamba的加速神器,可以用来并行下载和安装,大大加快速度,减少失败几率。 首先,mamba本身需要先通过conda来安装: conda install - 阅读全文
posted @ 2021-04-27 23:45 生物信息与育种 阅读(2990) 评论(0) 推荐(0) 编辑
摘要:生信软件绕不过Perl,Perl绕不过Bioperl。而Bioperl的安装总让人头大,尤其是对普通用户。以下错误你肯定经常遇到: Can't locate Bio/Seq.pm in @INC (you may need to install the Bio::Seq module) (@INC 阅读全文
posted @ 2021-04-25 15:46 生物信息与育种 阅读(5168) 评论(1) 推荐(0) 编辑
摘要:前言 将vcf转化为plink格式时,命令如下: plink --vcf snp.vcf --recode --allow-extra-chr --out test 出现错误: Error: Multiple instances of '_' in sample ID. If you do not 阅读全文
posted @ 2021-04-23 11:51 生物信息与育种 阅读(1634) 评论(0) 推荐(0) 编辑
摘要:需求 已知某基因组序列,染色体或scaffold ID顺序不定,想要对其按数字排序。 原顺序: 想要的排序结果: 实现 使用bioawk,没有的话conda直接安装。 bioawk -c fastx '{print}' old.genome.fa | \ sort -k1,1V | awk '{pr 阅读全文
posted @ 2021-04-22 18:09 生物信息与育种 阅读(727) 评论(0) 推荐(0) 编辑
摘要:问题 这个问题应该很常见吧。R中输出数据框时,想要把行名和列名都输出。如果直接输出的话,输出的结果列名会往前移动一位,这显然不是我们想要的。 直接上例子: > a = matrix(1:9, nrow = 3, ncol = 3, dimnames = list(LETTERS[1:3], LETT 阅读全文
posted @ 2021-04-18 18:11 生物信息与育种 阅读(1656) 评论(0) 推荐(0) 编辑
摘要:基因结构预测中同源注释策略,将mRNA、cDNA、蛋白、EST等序列比对到组装的基因组中,在文章中通常使用以下比对软件: tblastn gamp exonerate blat 根据我的实测,以上软件整体都比较慢。gmap可设置多线程来提升速度。tblastn虽然也可以,但对提速没什么影响。exon 阅读全文
posted @ 2021-04-16 12:11 生物信息与育种 阅读(3279) 评论(0) 推荐(0) 编辑
摘要:homology策略预测基因结构,下载了公共mRNA/CDS序列,考虑用gmap比对。本来是个很简单的脚本,但总是不那么顺利。 无论是用conda安装,还是源码安装较新版本,都存在问题。 gmap_build -D ./ -d reference reference.fa gmap -t 10 -D 阅读全文
posted @ 2021-04-15 22:43 生物信息与育种 阅读(1770) 评论(0) 推荐(0) 编辑
摘要:需求 一个数据框一列或多列中有重复行,如何将它的重复行转化为多列?即本来两列一对一的关系,如何转化为一对多的关系?普通的spread函数实现较为麻烦。 示例数据如下: Item Value Apricot 4 Apricot 2 Apricot 5 Banana 4 Carrot 7 Carrot 阅读全文
posted @ 2021-04-14 16:02 生物信息与育种 阅读(830) 评论(0) 推荐(0) 编辑
摘要:1.conda安装 conda安装虽然简单,但还是有很多坑,而且很多都是隐形的坑。 # conda install -c bioconda repeatmasker conda install -c bioconda repeatmodeler repeatmodeler依赖于repeatmaske 阅读全文
posted @ 2021-04-06 22:59 生物信息与育种 阅读(7768) 评论(2) 推荐(1) 编辑

点击右上角即可分享
微信分享提示