gRNA design | CRISPR Screen | single-cell | Perturb-seq | 数据分析
2023年06月08日
gRNA设计是CRISPR基因编辑的核心,KO比较简单,可选择的gRNA很多,而对于需要指定locus的编辑,如CRISPRa, CRISPRi, base editing等,可选择的就很少。
可以选择现成的工具:https://portals.broadinstitute.org/gppx/crispick/public
CRISPR衍生品很多,甚至可以编辑表观标记,EP300 dcas9
Epigenome editing by a CRISPR/Cas9-based acetyltransferase activates genes from promoters and enhancers - NBT - 2015
参考:
2023年05月03日
参考:
分析
先从数据分析开始:
安装
conda create -c bioconda -n mageckenv mageck # 0.5.9.5 source activate mageckenv # conda update mageck # source deactivate
barcode序列下载:https://www.addgene.org/pooled-library/liu-crispr-knockout-h3/
mageck count -l yusa_library.csv -n escneg --sample-label "plasmid,ESC1" --fastq ERR376998.fastq ERR376999.fastq mageck test -k escneg.count.txt -t ESC1 -c plasmid -n esccp
分析非常简单,两行代码就搞定了。
2023年06月14日
就我们实验室的数据而言,我们有三个fastq文件,每个3-4G,等于是三个重复,可以merge或分开处理获得显著性。
每个fastq可以被拆成9个样本,对应了9个细胞群体,等于9合一,加入了staggered p5 primers。
Illumina index is only on the p7 side
Novogene will give FASTQ based on the p7 barcode
Demultiplex based on the staggered p5 primers
原理
Nature Genetics:CRISPR Screen结合生化筛选获得功能基因
也很简单,就是gRNA侵染,然后按marker筛选Clone,然后做差异对比。比如抑制differentiation的gene KO应该富集在KRT20高表达的细胞里。
2023年02月27日
第一代perturb-seq:CROP-seq
- https://www.bocklab.org/resources/crop-seq
- Arrayed screens - 最开始的形式,就是类似smart-seq,低通量高质量高劳力
- combine pooled CRISPR screening - 10x模式
- Pooled CRISPR screening with single-cell transcriptome readout - nature methods - 2017
- 一句话总结:用lentivirous将sgRNA整合进genome,然后转录成带有polyA的mRNA,然后被固定在bead上的polyT捕获。gRNA依赖polyA。
- 由于盒大小的限制,CROP-seq被认为与多种sgRNA的递送不兼容。
- 第一批应用:Perturb-seq: Dissecting molecular circuits with scalable single cell RNA profiling of pooled genetic screens - 2017 - Cell
第一代其他:
- Dissecting Immune Circuits by Linking CRISPR-Pooled Screens with Single-Cell RNA-Seq - Science - 2016 【CRISP-seq】
- Multiplexed Engineering and Analysis of Combinatorial Enhancer Activity in Single Cells - Molecular cell - 2017 【Mosaic-seq】
第二代perturb-seq:direct guide RNA capture
- Combinatorial single-cell CRISPR screens by direct guide RNA capture and targeted sequencing - NBT - 2020
- Nature biotech. | 单细胞CRISPR组合化学引导下的精准测序
- 一句话总结:gRNA的捕获不再依赖polyA,而是特定的barcode序列。
第三代ClonMapper【我认为的第三代,可以将静态的RNA-seq变为动态的。】
- Multifunctional barcoding with ClonMapper enables high-resolution study of clonal dynamics during tumor evolution and treatment - 2021 - Nature cancer
- Nature Cancer | 肿瘤异质性和进化研究新利器,同时实现谱系追踪+组学分析
- Control of Lineage-Specific Gene Expression by Functionalized gRNA Barcodes
2022年09月10日
最近才开始摸这部分数据,但也算不错啦,直接上手single-cell的perturb-seq。
Mixscape流程简单易用,已经成功跑完了,结果也很make sense
参考:project/Data_center/analysis/Perturb_seq_Sethi/cellranger
接下来玩一下scMAGeCK
安装
conda install -c bioconda mageck pysam
大部分时间都在搞格式对接,明明Seurat已经够好用了,且已经整合为seurat格式了,却还是搞出这种畸形的接口,到底是人性使然,不想依附于人,受制于人。
问题:
- 基本原理
- 实际应用
GWAS是在大自然的数据中去筛选疾病associated genes
CRISPR Screening则是在人为的库里筛选疾病associated genes
分析:
- GWAS的最大用途就是大数据,样本量上去了就很好搞,但现在几乎很难搞到大数据了,已经被瓜分得差不多了,就算你有钱也搞不到,样本受医生的控制,适合关系党;
- CRISPR Screening不受限制,有钱就能筛,有一点的实验设计门槛,适合技术党;
核心的原理就是通过对比,找到表型关联基因,非常直接。
研究范文:
- CRISPR Screens Identify Essential Cell Growth Mediators in BRAF Inhibitor-resistant Melanoma - 2020
- 2021. In vivo CRISPR screens identify the E3 ligase Cop1 as a modulator of macrophage infiltration and cancer immunotherapy target. Cell
参考:
- 精准大海捞针--CRISPR screening专题