salmon快速基因和转录本定量 | isoform
参考前篇:可变剪切 | isoform | PSI | 单细胞 | suppa | salmon
salmon的定量是不基于序列比对的
Salmon基因定量是一种常用于RNA测序(RNA-seq)数据分析的方法,其原理是利用贝叶斯统计模型从RNA-seq reads中预测不同转录本或基因的表达量。 相比传统的基于比对的方法,它可以更准确地识别和量化转录本,并且能够更好地处理多样性的剪切形式。
我的目的有两个:
- 基因水平的快速定量
- 转录本/exon水平的快速定量
安装
1 2 | conda search salmon -c bioconda conda install -c bioconda salmon=1.10.2 |
1 | conda create --name RNAseq -c bioconda salmon=1.10.2 |
提取cellranger transcript,构建索引
1 2 3 | conda install -c bioconda gffread gffread -w cellranger.GRCh38.transcripts.fasta -g genome.fa genes.gtf salmon index -t cellranger.GRCh38.transcripts.fasta -i cellranger.GRCh38.salmon.index |
定量
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 | #!/bin/bash source /etc/profile #$ -S /bin/bash #$ -pe pvm 2 #$ -cwd #$ -N RNAseq export PATH= /home/zz950/softwares/self_bin :$PATH source /home/zz950/softwares/miniconda3/bin/activate /home/zz950/softwares/miniconda3/envs/RNAseq SampleCSV=all.samples.csv index= /home/zz950/reference/salmon/cellranger .mm10.salmon.index gtf= /home/zz950/reference/salmon/genes .gtf cpu=12 # ######################### main loop ############################# cat $SampleCSV | while IFS= "," read sample fq1 fq2; do ################################################################### salmon quant -i $index -l IU -1 $fq1 -2 $fq2 --validateMappings --gcBias --seqBias -g $gtf -o results/$sample done echo "all done" |
在R中合并table
参考:http://localhost:17435/notebooks/projects/bulk_NGS/RNA_seq/Cdx2_organoid_RA_RNA-seq/results/RNA-seq-count.ipynb
参考:
标签:
RNA
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)