上一页 1 ··· 19 20 21 22 23 24 25 26 27 ··· 38 下一页
摘要: Chi-square distribution introduction 这个视频真的好,完美地解释了卡方统计量是怎么来的! 我们有一个标准正态分布的总体,我们从其中抽一次,取该值的平方就是Q1统计量;抽两次,取两次值得平方和,就是Q2统计量;以此类推。。。 这就是自由度逐渐增加的卡方分布。 卡方分 阅读全文
posted @ 2018-04-05 11:13 Life·Intelligence 阅读(3473) 评论(0) 推荐(0) 编辑
摘要: 累了,写了一个多合一的读取函数,非常适合单细胞数据。 # quickly read large txt file to data.frame, matrix, or dgCMatrix fast.read.txt <- function(fileName, sep=",", format="data 阅读全文
posted @ 2018-03-28 17:16 Life·Intelligence 阅读(11611) 评论(0) 推荐(1) 编辑
摘要: ensembl/release91: 58302个ENSG id 56655个gene name(为什么有将近两千个是重复) 46种类型: GENCODE的注释gtf文件: ensembl 问题: 1. 为什么用gencode的注释文件做表达定量会出问题? 2. 不同的release之间有什么区别? 阅读全文
posted @ 2018-03-28 16:05 Life·Intelligence 阅读(6284) 评论(0) 推荐(0) 编辑
摘要: featureCounts真的很厉害。 常见的参数(没什么好说的,毕竟是固定的): 关键是以下几个参数怎么设置: 1. 什么时候需要在feature级别计数? 2. 是否要计多重比对? 3. 是否该只用最优比对? When --primary is specified, the -M option 阅读全文
posted @ 2018-03-27 17:49 Life·Intelligence 阅读(12894) 评论(0) 推荐(0) 编辑
摘要: 很实用的小技巧。 我们shell脚本写好了,但是想一行一行测试,怎么办。 笨方法:每行前面加一个 #,有时候我们原脚本里面本来就有注释,所以想再恢复的时候就麻烦了。 Bash Shell 注释多行的几种方法 阅读全文
posted @ 2018-03-27 16:06 Life·Intelligence 阅读(1640) 评论(0) 推荐(0) 编辑
摘要: 一直没时间碰这部分的内容,一是不擅长,二是不想摊子铺得太大。 现在是快要毕业了,主要的分析数据也发了,这部分如果再不做,马上别人拿到数据就可以分析了。 还有就是要清理集群,内存不够了,主要的分析做完了就可以给数据存档了。 最近看了一篇NC的lncRNA的分析文章,非常的有新意,当然也是结合了疾病模型 阅读全文
posted @ 2018-03-27 15:42 Life·Intelligence 阅读(1972) 评论(0) 推荐(0) 编辑
摘要: source activate /home/lizhixin/softwares/anaconda3/envs/splicing 建索引 mkdir GFP_index STAR --runThreadN 6 --runMode genomeGenerate --genomeDir GFP_inde 阅读全文
posted @ 2018-03-27 14:19 Life·Intelligence 阅读(3017) 评论(0) 推荐(0) 编辑
摘要: http://wiki.bits.vib.be/index.php/Identify_the_Phred_scale_of_quality_scores_used_in_fastQ 用别人的工具会比价靠谱,自己写容易出错,或考虑不周: BBMap as a little tool for this: 阅读全文
posted @ 2018-03-27 13:43 Life·Intelligence 阅读(2756) 评论(0) 推荐(0) 编辑
摘要: TrimGalore 就是一个简单的perl wrapper,打包了fastqc和cutadapt,但是却非常实用。 因为cutadapt的参数选择实在是有够复杂,光接头类型就有5种,还有各种参数,大哥,我就想去去接头、trim一下质量而已,你就不能自动搞了吗。不要给选择困难症的我这么多选择啊。 想 阅读全文
posted @ 2018-03-27 13:26 Life·Intelligence 阅读(6077) 评论(0) 推荐(0) 编辑
摘要: 折腾这么多都是白瞎,STAR就有输出没有别对上的pair-end reads的功能 参见:How To Filter Mapped Reads With Samtools I had the same issue but with Paired End Reads, and I solved usi 阅读全文
posted @ 2018-03-27 01:00 Life·Intelligence 阅读(5283) 评论(0) 推荐(0) 编辑
摘要: 开源的生物信息世界居然有这么个需要注册才能下载的工具,开源世界不是怎么方便怎么来吗? 这个注册真的麻烦,这里上传了一个可以使用的版本。 RepBaseRepeatMaskerEdition-20170127.tar.gz 想转成fasta可以用如下命令: 其中awk.sh文件内容为: 阅读全文
posted @ 2018-03-26 23:27 Life·Intelligence 阅读(1414) 评论(0) 推荐(0) 编辑
摘要: Nr,GenBank, RefSeq, UniProt 数据库的异同 有的文章在做DEG分析时,会把reads比对到RefSeq的转录组上。我也没搞清楚这和直接比对到常规转录组上有什么区别。 文章:Single-Cell Transcriptome Analysis Reveals Dynamic  阅读全文
posted @ 2018-03-26 22:16 Life·Intelligence 阅读(1372) 评论(0) 推荐(0) 编辑
摘要: cutadapt 参考:用cutadapt软件来对双端测序数据去除接头 fastqc可以用于检测,检测出来了怎么办? 看了几篇高水平文章,有不少再用cutadapt,虽然有时候数据真的不错,但是还是要质控一下,修剪一下。 待续~ 阅读全文
posted @ 2018-03-26 20:03 Life·Intelligence 阅读(2520) 评论(0) 推荐(0) 编辑
摘要: The normalization method described above aims to reduce the effect of technical factors in scRNA-seq data (primarily, depth) from downstream analyses. 阅读全文
posted @ 2018-03-26 05:49 Life·Intelligence 阅读(1623) 评论(0) 推荐(0) 编辑
摘要: 基因组里的小写字母的序列就是soft masking,也就是被标记的重复序列。 怎么把重复序列提取出来,保存为bed文件? 参考:Uppercase vs lowercase letters in reference genome 阅读全文
posted @ 2018-03-26 00:00 Life·Intelligence 阅读(1722) 评论(0) 推荐(0) 编辑
摘要: 参见: Question: How to extract all non-seqenced positions from a genome (Fasta file)? test.fa perl一行命令 转为规范化的bed 阅读全文
posted @ 2018-03-25 23:14 Life·Intelligence 阅读(1510) 评论(0) 推荐(0) 编辑
摘要: What Ensembl genome version should I use for alignments? (e.g. toplevel.fa vs. primary_assembly.fa) 这是一个很细节也很实际的问题,到底用哪个版本? 参考: What Ensembl genome ve 阅读全文
posted @ 2018-03-25 19:40 Life·Intelligence 阅读(4600) 评论(0) 推荐(0) 编辑
摘要: 常见的ORF预测工具 Open Reading Frame Finder - NCBI ORF Finder - SMS OrfPredictor - YSU 基本概念 开放阅读框(英语:Open reading frame;缩写:ORF;其他译名:开放阅读框架、开放读架等)是指在给定的阅读框架中, 阅读全文
posted @ 2018-03-25 17:52 Life·Intelligence 阅读(9233) 评论(0) 推荐(0) 编辑
摘要: fai示例: http://www.htslib.org/doc/faidx.html offset比较让人费解,其实就是 bytes starting from zero,文件层次的属性,一般不需要关注。 有时需要将fasta转为bed,就是统计长度就好了,但是利用samtools faidx这个 阅读全文
posted @ 2018-03-25 16:12 Life·Intelligence 阅读(3931) 评论(0) 推荐(0) 编辑
摘要: 我们生信技能书有一篇介绍bedtools的文章,可以在微信里搜着看下,非常有用。 bedtools 用法大全 http://bedtools.readthedocs.io/en/latest/ gtf转bed用Linux命令完全可以实现,因为gtf每一行比较规律,不像fasta和fastq。 后面发 阅读全文
posted @ 2018-03-25 04:16 Life·Intelligence 阅读(13411) 评论(0) 推荐(0) 编辑
上一页 1 ··· 19 20 21 22 23 24 25 26 27 ··· 38 下一页
TOP