摘要:
2023年01月28日 Moreover, genomics often cannot distinguish “passenger” mutations from “drivers” that promote tumorigenesis and might be therapeutic targe 阅读全文
摘要:
除了刚接触10x的那会儿,还真没怎么亲自倒腾过fastq的制作。 正常从测序商那里拿到的应该是bcl的原始数据,需要自己做一步bcl2fastq。 后面大家都觉得这一步太麻烦了,没必要,所以大部分测序商也就自己做了。 这也是对的,生信分析的起点是fastq,不应该是bcl,数据保存的最原始格式也应该 阅读全文
摘要:
有的包在升级后函数和API就完全变了,甚至删除了一切原来的功能函数,这导致后面分析数据非常的畸形。 但没办法,接下了这样的项目,含着泪也得做出点东西出来,于是我就想同时把两个包装上。 python是肯定不行的,网上有一些教程,但都不能正常工作。 于是曲线救国,那我就把包下载到本地,然后用sublim 阅读全文
摘要:
transcription factor perturbation gene-sets 目的比较直接:我有个DEG基因集,我想要知道那个TF最有可能调控这个基因集。 Transcription factor perturbation gene ontology analysis (EnrichR) 阅读全文
摘要:
2023年08月28日 从我第一次接触motif分析开始,就意识到motif数据库的不完善,那么多的已知的TF,有较为明确motif的却不到一半,已知的部分质量也不高。 而motif其实至关重要,它是Protein与DNA互作的pattern和证据,蛋白与DNA的互作也决定了基因的转录,染色质的表观 阅读全文
摘要:
目前对peak的数据处理上,发现测序深度对peak的数量有很大影响,即使做了normalization也没办法,所以这里希望从原始的bam文件开始做downsampling。 参考一:Downsample BAM file to specific amount of reads input_dir= 阅读全文
摘要:
2024年09月09日 Diffbind其实功能非常强大,我还在探索。可以极速分析成图,也可以精细的个性化定制。工程化做得非常好,代码都被封装起来了,看不到源码。 dba.plotProfile,这个核心的Heatmap成图就很厉害。 今天,我花了快一个多小时来探索,如何自定义Heatmap的颜色, 阅读全文
摘要:
常在河边走,哪能不湿鞋。 作为生信工作者,尤其是计算生物学,遇到BUG真的是不能太常见,能否顺利DEBUG是此行业工作者的基本功。 Mac MacMini M1芯片则有些包装不了,在osx-64上的包,无法在osx-arm64上安装。 注意:千万不要在M1的Mac上装M1的conda!!!【直接装x 阅读全文
摘要:
2023年05月04日 在搞懂DiffBind后就几乎没有用过deeptools,因为R可以用jupyter notebook,代码和结果方便撰写和保存。 但是,最近被怼了,质疑了我的peak calling,一个核心的问题就是macs call出来的peak太多了,有6万个左右,我觉得这个比较正常 阅读全文
摘要:
一般在传输过程中中断,fastq就会truncate,但仍然可以用zless或者zcat打开查看。 真到万不得已的时候还是要截取可以利用的部分,然后用bbmap修复一下。 bbmap repair.sh -Xmx14g in1=1.fq.gz in2=2.fq.gz out1=1_1.fq.gz o 阅读全文
摘要:
10x是最成功的单细胞公司,目前最成功的商业平台,已经有很多成熟的单细胞产品线,不管是新手还是进阶的高手都在玩他们平台产生的数据。 这里试图对10x的核心技术和数据来做一个剖析,试图理解其核心原理,加速数据分析进程,辅助科研发现。 我目前玩过的10x数据: scRNA-seq (antibody h 阅读全文
摘要:
这个要严谨一点,众所周知,小鼠是小写,人是大写,以前为了方便都是直接一个toupper函数完成转换,但这样做实在是太粗糙了,大概有三分之一的基因会丢失。 我简单统计了一下: 人鼠同源的有23242个基因注释,其中有7695个基因是无法简单对应的,所以你之前的分析会漏掉很多基因。 建议使用ensemb 阅读全文
摘要:
2023年04月24日 参考:decoupleR:丰富你的通路富集分析结果 2022年12月28日 没想到碰到了一个神器:PROGENy。可以给常见的14种signaling pathway活性打分。 参考:看着14个肿瘤相关通路活性就够了 buik RNA-seq: http://localhos 阅读全文
摘要:
搜索历史文件真的是最基本的需求,听说everything是个好东西,但Mac平台自带的splotlight search已经足够好用,直达文件。 Linux我则不太会搜索,find命令有点复杂,最近无意搜索Linux平台是否有类似everything的工具,还真发现了一个非常活跃的fzf工具,非常好 阅读全文
摘要:
好久没有继续我的学习/写作/科普大业了,这个positive feedback loop是非常powerful的。 这一期的主题,Apc - Wnt - CRC 这也是我今后的研究主题。 先抛出问题: Wnt pathway的组成成分有哪些,都控制了哪些重要的细胞功能? 正常情况下,Apc是如何与W 阅读全文
摘要:
2023年11月22日 居然到今天才开始了解10x多组学建库的原理,开始尝到这个技术的甜头了,有很多问题只有这个技术能够回答,比如表观的plasticity。 这里的多组学其实是multi-modal,即一个细胞同时测scRNA-seq和scATAC-seq,而不是单独测然后integarte,它们 阅读全文
摘要:
2023年02月06日 太nb了,今天居然才发现这个神器轮子,想法其实很简单,从各个格式里提取三个矩阵(count matrix,col anno, row anno),然后创建新的对象,自己也可以做,但人家封装好了,你只需要载入包,一行命令即可完成转换。h5ad格式很小,而且可以跟cellxgen 阅读全文
摘要:
大型Cancer数据库 TCGA ICGC 目前已知的oncogene 什么是oncogene?跟其在癌症中的表达量无关,而是作用,主动去激发cancer的gene才算,这些基因正常情况下都是有自己作用的(proto-oncogene),被mutated/over-expressed之后才变为onc 阅读全文
摘要:
英语真的不太行,阅读和写作没问题,听力和口语则严重拉胯。 表现在科研presentation上,则是汇报讲述时,水平一流;一旦被提问,则变成哑巴;最糟糕的,一旦聊起生活,更像个弱智,最简单的日常用语都不会表达。 我最终的目的: 日常能与人顺利交谈; 能做到接近完美的学术汇报; Native spea 阅读全文
摘要:
2022 - CMGH - A Proximal-to-Distal Survey of Healthy Adult Human Small Intestine and Colon Epithelium by Single-Cell Transcriptomics 2018 - GB - Cell 阅读全文