随笔分类 - bio
摘要:紧接前文,各个样本序列组装完毕后,下一步自然是想要弄清楚组装出来的序列中到底是些啥子东西嘛。基因预测方法和工具见这篇推文。 注释工具 常见原核生物基因注释包括 prokka、Prodigal、GeneMark等工具。 这里使用Prodigal对组装的基因组序列进行基因预测: Prodigal软件参数
阅读全文
摘要:紧接上文, 质控去除宿主(土壤样本不需要去宿主)后下一步对样本序列进行组装。 1、组装工具 宏基因组学中常用序列组装工具不少,如SOAPdenovo2、megagit,spades、metaSPAdes、MOCAT2、IDBA-UD等各有优劣,下面两个软件是分析过程中比较常用的。 spades:ht
阅读全文
摘要:1、测序数据 数据来源于密歇根大学的一项研究,数据项目号为PRJNA389927。这个研究项目的包括正常、癌前病变和癌症病人样本共181例。项目对应的github地址:https://github.com/SchlossLab/Hannigan_CRCVirome_mBio_2018 ,也可以直接去
阅读全文
摘要:一个比fastANI更快更准确的工具 paper:Fast and robust metagenomic sequence comparison through sparse chaining with skani | Nature Methods git:bluenote-1577/skani:
阅读全文
摘要:一、 软件安装: conda search 仓库是有结果的,安装却死活安装不上,直接pip安装成功了,用的清华的源,执行完pip install humann 等了近20min才显示安装完成。 输入humann出现如下信息表示安装成功,接下来安装相应数据库文件。 usage: humann [-h]
阅读全文
摘要:usage: 脚本就不注释了,会perl的都看得懂;测试了下,速度感人OTZ,淦! #!/usr/bin/env perl use strict; use warnings; use Cwd qw/getcwd/; use Getopt::Long; use Net::FTP; use featur
阅读全文
摘要:一个用于处理fastq测序文件的命令行小工具,功能还在不断更新中,子命令也不多,支持gzip压缩文件的输入和输出(结果文件名以.gz结尾,结果会自动压缩)。 reop: https://github.com/sharkLoc/fqkit install: cargo install fqkit us
阅读全文
摘要:# Per-base per-nucleotide depth analysis 统计bam文件每个位置的测序深度、和各种碱基深度、还包括indel,支持多线程。 ### github: `https://github.com/sstadick/perbase.git` ### install: `
阅读全文
摘要:[上一篇](https://www.cnblogs.com/mmtinfo/p/16842120.html)博文中写到出了这个小工具,现在更新到0.2.5了,新增了一些子命令。有seqtk,seqkit等好用的工具珠玉在前,还写这个主要是学习和熟悉rust这门语言的基础语法了,写出来自己玩儿咯。 #
阅读全文
摘要:web url: https://earray.chem.agilent.com/suredesign/index.htm 登录后下载  * 群体规模:2999人 * 数据类型:位点注释数据(hg38 含有糖尿病患者);数据未开放下载,按区域/位点/基因 可在线查询 * 资源:[女娲基因组资源 (ibp.ac.cn)](http://bigdata.ibp.ac.cn/Ny
阅读全文
摘要:在本地使用blastn做序列比对时,若序列长度太短,比如长度不足30bp,是不会有任何比对结果输出的,之前也遇到过这个问题。今天逛论坛看到了,解决办法是指定参数-task,执行网页blast模式,亲测可用。 eg : blastn -query test.fa -db db_blast -evalu
阅读全文
摘要:datasets NCBI出品跨平台轻松批量从数据库中下载数据的命令行工具 指南: 工具处于快速更新迭代阶段,正逐步添加新功能,,参考网址:https://www.ncbi.nlm.nih.gov/datasets/docs/v1/how-tos/ 安装: curl -o datasets 'htt
阅读全文
摘要:双端测序数据barcode拆分工具 目前只支持单barcode拆分 支持gz压缩文件输入输入 参数支持barcode碱基容错 支持一个样本对应多个barcode repo : github : https://github.com/sharkLoc/fqkit.git install : cargo
阅读全文
摘要:相关工具: https://github.com/adaptivegenome/repeatseq https://github.com/DecodeGenetics/popSTR https://www.ruhr-uni-bochum.de/spezzoo/cm/cm_phobos.htm htt
阅读全文
摘要:bamkit 功能很简陋,后续有空再添加些其他功能,当然也可能没有后续了😁 install cargo install bamkit # or git clone https://github.com/sharkLoc/bamkit.git cd bamkit cargo b --release
阅读全文
摘要:断断续续的学了些rust语法,就想着写些简单的东西,以熟悉语法为主。这次主要针对fasta文件的简单处理写了fakit,参数也不多可以利用管道组合使用,主要是复杂的功能我不会,哈哈。 github: https://github.com/sharkLoc/fakit install git clon
阅读全文
摘要:bamcov:一个基于命令行的可视化bam文件深度的工具。 软件采用C语言编写,下载附带测试数据,参数较少,使用方便。 github : https://github.com/fbreitwieser/bamcov install : git clone --recurse-submodules h
阅读全文
摘要:前面写了一个fastq文件统计结果的可视化小软件,https://www.cnblogs.com/mmtinfo/p/16428960.html,抽空把测序质量分布热图补上了。大概这个样子,丑了点,将就着看,质量值和位置对应的数据越多,颜色就越深。后面抽空把命令行参数加上,可以指定输出图片的名字,图
阅读全文
摘要:很久没更新博客了,惭愧OTZ.废话不多说,交作业啦(ง •_•)ง,学了一点rust基础,写了一个可视化fastq文件的小工具。 1、安装 地址:https://github.com/sharkLoc/visual_fq ,因为是linux平台下的工具(win下也是可以的嘛💪),预先安装依赖 。
阅读全文