salmon快速基因和转录本定量 | isoform
参考前篇:可变剪切 | isoform | PSI | 单细胞 | suppa | salmon
salmon的定量是不基于序列比对的
Salmon基因定量是一种常用于RNA测序(RNA-seq)数据分析的方法,其原理是利用贝叶斯统计模型从RNA-seq reads中预测不同转录本或基因的表达量。 相比传统的基于比对的方法,它可以更准确地识别和量化转录本,并且能够更好地处理多样性的剪切形式。
我的目的有两个:
- 基因水平的快速定量
- 转录本/exon水平的快速定量
安装
conda search salmon -c bioconda conda install -c bioconda salmon=1.10.2
conda create --name RNAseq -c bioconda salmon=1.10.2
提取cellranger transcript,构建索引
conda install -c bioconda gffread gffread -w cellranger.GRCh38.transcripts.fasta -g genome.fa genes.gtf salmon index -t cellranger.GRCh38.transcripts.fasta -i cellranger.GRCh38.salmon.index
定量
#!/bin/bash source /etc/profile #$ -S /bin/bash #$ -pe pvm 2 #$ -cwd #$ -N RNAseq export PATH=/home/zz950/softwares/self_bin:$PATH source /home/zz950/softwares/miniconda3/bin/activate /home/zz950/softwares/miniconda3/envs/RNAseq SampleCSV=all.samples.csv index=/home/zz950/reference/salmon/cellranger.mm10.salmon.index gtf=/home/zz950/reference/salmon/genes.gtf cpu=12 # ######################### main loop ############################# cat $SampleCSV | while IFS="," read sample fq1 fq2; do ################################################################### salmon quant -i $index -l IU -1 $fq1 -2 $fq2 --validateMappings --gcBias --seqBias -g $gtf -o results/$sample done echo "all done"
在R中合并table
参考:http://localhost:17435/notebooks/projects/bulk_NGS/RNA_seq/Cdx2_organoid_RA_RNA-seq/results/RNA-seq-count.ipynb
参考: