salmon快速基因和转录本定量 | isoform

参考前篇:可变剪切 | isoform | PSI | 单细胞 | suppa | salmon

salmon的定量是不基于序列比对的

Salmon基因定量是一种常用于RNA测序(RNA-seq)数据分析的方法,其原理是利用贝叶斯统计模型从RNA-seq reads中预测不同转录本或基因的表达量。 相比传统的基于比对的方法,它可以更准确地识别和量化转录本,并且能够更好地处理多样性的剪切形式。

 

我的目的有两个:

  1. 基因水平的快速定量
  2. 转录本/exon水平的快速定量

 

安装

1
2
conda search salmon -c bioconda
conda install -c bioconda salmon=1.10.2

 

1
conda  create --name RNAseq -c bioconda salmon=1.10.2

  

提取cellranger transcript,构建索引

1
2
3
conda install -c bioconda gffread
gffread -w cellranger.GRCh38.transcripts.fasta -g genome.fa genes.gtf
salmon index -t cellranger.GRCh38.transcripts.fasta -i cellranger.GRCh38.salmon.index

 

定量

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#!/bin/bash
source /etc/profile
#$ -S /bin/bash
#$ -pe pvm 2
#$ -cwd
#$ -N RNAseq
 
export PATH=/home/zz950/softwares/self_bin:$PATH
source /home/zz950/softwares/miniconda3/bin/activate /home/zz950/softwares/miniconda3/envs/RNAseq
 
SampleCSV=all.samples.csv
index=/home/zz950/reference/salmon/cellranger.mm10.salmon.index
gtf=/home/zz950/reference/salmon/genes.gtf
 
cpu=12
 
# ######################### main loop #############################
cat $SampleCSV | while IFS="," read sample fq1 fq2; do
###################################################################
salmon quant -i $index -l IU -1 $fq1 -2 $fq2 --validateMappings --gcBias --seqBias -g $gtf -o results/$sample
 
done
 
echo "all done"

 

在R中合并table

参考:http://localhost:17435/notebooks/projects/bulk_NGS/RNA_seq/Cdx2_organoid_RA_RNA-seq/results/RNA-seq-count.ipynb 

  

 

 

参考:

 

posted @   Life·Intelligence  阅读(489)  评论(0编辑  收藏  举报
(评论功能已被禁用)
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
TOP
点击右上角即可分享
微信分享提示