【fastqe】有趣的表情包版fastqc
FASTQ with Emoji = FASTQE 🤔
表情版的FASTQC,适用于Illumina 1.8+/Sanger format
使用
安装 使用conda 或者pip
$ pip install fastqe
$ conda install -c bioconda fastqe
测试数据下载
$ wget https://zenodo.org/record/3977236/files/female_oral2.fastq-4143.gz
默认是给出平均值,计算fastq文件中的序列最大值和最小值,需要加参数--max,--min
$ fastqe female_oral2.fastq-4143.gz --max --min
输出
我们知道fastq文件中质量值以ASCII字符来表示,fastqe 运行时,加上--scale参数,会给出每个表情对应的ascii字符。
#scale for fastqe
# 0 ! 🚫
# 1 " ❌
# 2 # 👺
# 3 $ 💔
# 4 % 🙅
# 5 & 👾
# 6 ' 👿
# 7 ( 💀
# 8 ) 👻
# 9 * 🙈
# 10 + 🙉
# 11 , 🙊
# 12 - 🐵
# 13 . 😿
# 14 / 😾
# 15 0 🙀
# 16 1 💣
# 17 2 🔥
# 18 3 😡
# 19 4 💩
# 20 5 ⚠️
# 21 6 😀
# 22 7 😅
# 23 8 😏
# 24 9 😊
# 25 : 😙
# 26 ; 😗
# 27 < 😚
# 28 = 😃
# 29 > 😘
# 30 ? 😆
# 31 @ 😄
# 32 A 😋
# 33 B ☺️
# 34 C 😝
# 35 D 😛
# 36 E 😜
# 37 F 😉
# 38 G 😁
# 39 H 😄
# 40 I 😎
# 41 J 😍
若我们只是简单关心下序列质量好坏程度得一个范围,我么可以用--bin参数。它将一个范围内的质量值以一个表情来表示
$ fastqe female_oral2.fastq-4143.gz --min --max --scale --bin
#scale for fastqe
# 0 ! 🚫
# 1 " 🚫
# 2 # 💀
# 3 $ 💀
# 4 % 💀
# 5 & 💀
# 6 ' 💀
# 7 ( 💀
# 8 ) 💀
# 9 * 💀
# 10 + 💩
# 11 , 💩
# 12 - 💩
# 13 . 💩
# 14 / 💩
# 15 0 💩
# 16 1 💩
# 17 2 💩
# 18 3 💩
# 19 4 💩
# 20 5 ⚠️
# 21 6 ⚠️
# 22 7 ⚠️
# 23 8 ⚠️
# 24 9 ⚠️
# 25 : 😄
# 26 ; 😄
# 27 < 😄
# 28 = 😄
# 29 > 😄
# 30 ? 😆
# 31 @ 😆
# 32 A 😆
# 33 B 😆
# 34 C 😆
# 35 D 😎
# 36 E 😎
# 37 F 😎
# 38 G 😎
# 39 H 😎
# 40 I 😍
# 41 J 😍
看,平均值,序列数据有一半是警告或者狗屎。。。
biomojify
将你的序列数据以Emoji来展示,
安装也是pip
$ pip install biomojify
将DNA ATCG序列 转为 🥑🍅🌽🍇:
fastq数据也可以转
$ zcat female_oral2.fastq-4143.gz | head -n 4 > test.fq
查看其帮助文档, 蛋白质序列,vcf也可以转
$ biomojify -h
usage: biomojify [-h] [--version] [--log LOG_FILE] {fasta,fasta_protein,fastq,vcf} ...
Read one or more FASTA or FASTQ files, and convert them to emoji.😀
positional arguments:
{fasta,fasta_protein,fastq,vcf}
sub-command help
fasta fasta --help
fasta_protein fasta_protein --help
fastq fastq --help
vcf vcf --help
optional arguments:
-h, --help show this help message and exit
--version show program's version number and exit
--log LOG_FILE record program progress in LOG_FILE