使用MetaLogo对不等长序列绘制Sequence logo
最近,我的好朋友开发了一个名为MetaLogo的工具,旨在为具有异质性的序列制作sequence logo。
MetaLogo 布局
我们都知道WebLogo可以制作sequence logo,但是,与其他sequence logo生成器一起,这些工具只能接受等长的序列。虽然多序列比对 (MSA) 似乎是一种解决方案,但这一点也不完美。我们只是有时需要区分序列的长度。例如,当我们分析免疫组库时,我们肯定知道 14-bp CDR3 和 30-bp CDR3 可以完全针对不同的抗原,而 MSA 毫无帮助。我们需要按长度将序列分成不同的组。然后我们需要一个工具来为每个组绘制sequence logo并将它们组合成一个图形。如果该工具可以对这些sequence logo进行一些对齐和填充,以突出不同组序列之间的异同,那就完美了!
再者,在我们查看序列logo时,往往由于序列中包含多组信息,或者噪声信息,导致我们的logo图会有信息受到干扰或者收到平均,无法精确的体现序列中的结构。比如靶向不同抗原的两组抗体序列,如果把他们混在一起,直接做sequence logo,可能得不到清晰的motif模式。如果工具能够自动识别序列中的异质性,按照进化关系将他们分组,并分别绘制sequence logo,那将及大的帮助我们的分析!
因此,我们开发了MetaLogo!
您可以直接输入您的序列文件,其中包含数千个不同长度的序列,并制作您对齐的多个sequence logo。他会自动检查序列中的异质性,对序列分组;当然,你也可以仅仅要求它按长度分组。
更重要的是,MetaLogo 可以制作漂亮且高度可定制的sequence logo。您可以访问它的公共Web服务器(http://metalogo.omicsnet.org),也可以安装python包(pip install MetaLogo)。您甚至可以在本地网络中轻松构建自己的 Web 服务器。一个临时开发服务器和一个高效的生产 docker 服务器都可用。
太棒了。去尝试一下。这是教程:https://github.com/labomics/MetaLogo/wiki,这里是网络服务器(http://metalogo.omicsnet.org)。
如果你有任何问题,请在这里留言,或者在github上创建一个问题,你也可以给我发邮件(在MetaLogo webserver中找到地址)。
谢谢。