03 2016 档案

利用kseq.h parse fasta/fastq 文件
摘要:在分析中经常需要统计fasta/fastq文件的序列数和碱基数, 但是没有找到一些专门做这件事的小工具,可能是这个功能太简单了; 之前用自己写的perl的脚本统计这些信息, 当fastq文件非常大时,就变的很慢; 今天在网上搜到kseq.h可以parse fasta/fastq文件,用C写的, 速度 阅读全文

posted @ 2016-03-22 17:01 庐州月光 阅读(1948) 评论(0) 推荐(0) 编辑

BWT转换对字符串进行编码
摘要:今天看了下bowtie 的论文, 里面描述了BWT转换的过程和bowtie的比对算法; NGS测序数据的数据量非常大, 为了更快的处理, 通常需要对数据进行压缩;而BWT实际上就是一种数据转换方法, 将原始序列经过BWT转换后, 可以更方便的进行压缩;而且BWT转换是一个可逆的转换,能够根据转换后的 阅读全文

posted @ 2016-03-07 16:44 庐州月光 阅读(2295) 评论(0) 推荐(0) 编辑

bowtie2-inspect 根据bowtie2的索引取得fasta 序列
摘要:今天运行tophat2的时候看到下面这条记录: [2016-02-27 11:40:03] Checking for reference FASTA file Warning: Could not find FASTA file /home/pub/database/Human/hg19/bowti 阅读全文

posted @ 2016-03-02 11:41 庐州月光 阅读(3027) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示