使用mummer做两个genomes的dotplot

第一篇博客,初来乍到,欢迎交流哈。未经本人授权禁止转载

 

 

记录一下mummer做dotplot的过程:

1.下载mummer,官网在http://mummer.sourceforge.net/ 再配环境变量,也可以直接apt-get install mummer。

  如果要画图还要安装gnuplot, libx11-dev包。

2.将需要比对的两个fasta文件(A.fasta, B.fasta)放到新建的目录下,然后用nucmer -maxmatch -c 100 A.fasta B.fasta -p result

  将得到all-all的比对文件result.delta。

  之所以用nucmer是因为我的两个序列同源性较高,而且每个fasta是个multisequences的文件,包括多个scaffolds。

  这个地方一定需要注意的是:原始fasta的header格式要对,而且一定换行符要对。因为windows下是\n\r的,所以在win下生成的文件到linux下会不识别。所以win的序列需要用ue做dos到unix的转换。否则会报no alignment data to plot 的错误。

3.下面可以做多种分析,我这次只画dotplot,所以mummerplot -large -fat(or -l) -nocolor -postscript -p dotplot result.delta

  因为scaffolds有点多,图里面的grids太密了。但貌似没有选项可以删(也许在gnuplot里,不过没研究过,时间紧张算了),所以拷回来用win改吧。

4.输出为dotplot.ps文件。

  可以在win下用corelDraw或者Ai修改(我的corelDraw显示有问题,所以先用Ai改的)。

 

2015.12.16备注:nucmer 的 -l -c 参数对于比较短的匹配可以有一个过滤,如果杂点太多可以将它调大

 

posted on 2015-09-19 22:37  cenkai  阅读(2184)  评论(0编辑  收藏  举报