上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 38 下一页
摘要: 与之对应的是single cell RNA-Seq,后面也会有类似文章。 参考:https://github.com/xuzhougeng/Learn-Bioinformatics/ 作业:RNA-seq基础入门传送门 资料:RNA-seq Data Analysis-A Practical App 阅读全文
posted @ 2017-08-02 16:39 Life·Intelligence 阅读(6628) 评论(0) 推荐(0) 编辑
摘要: 参考: 诱导性多能干细胞 Induced pluripotent stem cell Induced Pluripotent Stem Cells: Problems and Advantages when Applying them in Regenerative Medicine Induced pluripotency: history, mechanisms, and applica... 阅读全文
posted @ 2017-08-02 11:08 Life·Intelligence 阅读(436) 评论(0) 推荐(0) 编辑
摘要: 转自生信技能树微信公众号,作者果子 距离上次的承诺已经过去了1月,今天就来补上上回的坑。说实话,现在大部分公众号已经创作乏力,我估摸着已经1个月没有点开关注的公众号了,因为在上一个月我就发现,已经没有什么能够让我虎躯一震,要知道在以前我可是每天刷新,不断收藏的,要不然印象笔记里面也不会有1万多条笔记,以前不知道如何分享,权当做自己的精囊,写错了是锦囊,都是在师妹困难的时候发挥作用,而现在,微信允许... 阅读全文
posted @ 2017-08-02 10:00 Life·Intelligence 阅读(1572) 评论(0) 推荐(0) 编辑
摘要: 说来惭愧,居然没有在Linux安装R的经验,因为一直很少用R,用也是在win平台。 下载路径:https://cran.rstudio.com/src/base/R-3/ 强烈建议不要安装最新的R,除非你有特殊需求,否则你会遇到一大堆问题(加载动态库、包兼容性)。 package 'rhdf5' is not available (for R version 3.2.5) 版本太低也不好,一般选择... 阅读全文
posted @ 2017-08-01 21:19 Life·Intelligence 阅读(1285) 评论(0) 推荐(0) 编辑
摘要: mismatch到底只是一个碱基替换,还是也包括了插入缺失? If two sequences in an alignment share a common ancestor, mismatches can be interpreted as point mutations and gaps as indels (that is, insertion or deletion mutations) ... 阅读全文
posted @ 2017-08-01 10:11 Life·Intelligence 阅读(883) 评论(0) 推荐(0) 编辑
摘要: 什么是高通量测序技术中的多重测序? 多重测序是指将带有特殊分子标签(barcode或者index)的不同来源的DNA标本,放入一个反应体系进行测序的方法。与一次检测一种来源的DNA相比,多重检测通过分子标签来区分不同的DNA标本,从而在提高测序的高效性的同时也确保测序的准确性。 人类个体的基因组是30亿个碱基对,即3Gb(3 giga base pairs,即3X109碱基对)。目前的高通量测序仪... 阅读全文
posted @ 2017-07-31 10:24 Life·Intelligence 阅读(5663) 评论(0) 推荐(0) 编辑
摘要: 自己电脑上还是有个自己的虚拟机比较方便,之前用的Ubuntu,发现卡得不行。 现在装了个轻量级的Lubuntu,速度提升了不少。 1.下载Lubuntu,安装。 2.进入,设置root密码,初始化root密码,sudo passwd 3.安装VM-tools,解压到指定目录,安装就好。perl vmware-install.real.pl 3.开启ssh,sudo apt-get install ... 阅读全文
posted @ 2017-07-29 21:20 Life·Intelligence 阅读(1222) 评论(0) 推荐(0) 编辑
摘要: C/C++的速度是Python和perl所无法比拟的,尤其对于处理超大的生物信息学文件来说。 最近在写一个最简单的fastq cut工具,Python简直慢到不能忍,8G的fastq.gz文件的cut需要6-7个小时,而C++则只需要15-20min,简直就不在一个量级。 当然,听说Python有个cpython机制,可以加快速度,但和纯C++还是有差距的。 C++的编译比较复杂,这里只能做个... 阅读全文
posted @ 2017-07-27 15:15 Life·Intelligence 阅读(578) 评论(0) 推荐(0) 编辑
摘要: 基本格式 : * * * * * command 分 时 日 月 周 命令 第1列表示分钟1~59 每分钟用*或者 */1表示 第2列表示小时1~23(0表示0点) 第3列表示日期1~31 第4列表示月份1~12 第5列标识号星期0~6(0表示星期天) 第6列要运行的命令 crontab文件的一些例子: 30 21 * * * /usr/local/etc/rc.d/lightt... 阅读全文
posted @ 2017-07-26 14:56 Life·Intelligence 阅读(367) 评论(0) 推荐(0) 编辑
摘要: 1.以前的方法如果是要获得程序运行的当前目录所在位置,那么可以使用os模块的os.getcwd()函数。如果是要获得当前执行的脚本的所在目录位置,那么需要使用sys模块的sys.path[0]变量或者sys.argv[0]来获得。实际上sys.path是Python会去寻找模块的搜索路径列表,sys.path[0]和sys.argv[0]是一回事因为Python会自动把sys.argv[0]加入s... 阅读全文
posted @ 2017-07-25 17:39 Life·Intelligence 阅读(563) 评论(0) 推荐(0) 编辑
摘要: 2023年03月31日 cellranger pipeline基本是对的,但想要更原始的数据还是得自己手动count。 这两批perturb-seq的问题在于,Plasmid的设计,无法区分原始的和编辑后的Plasmid,长度一样,于是做cell sorting的时候一大堆dummy cells就被 阅读全文
posted @ 2017-07-21 16:19 Life·Intelligence 阅读(3395) 评论(0) 推荐(0) 编辑
摘要: 转自:http://blog.csdn.net/lhf_tiger/article/details/8203013 真恶心,10X流程产生的csv文件的行位居然有^M字符,害我一直在找报错原因,真是坑,还好最后我找出来了。一直在用Python,perl是越来越不熟练了。调试花了好久。 替换^M字符在Linux下使用vi来查看一些在Windows下创建的文本文件,有时会发现在行尾有一些“^M”。有几... 阅读全文
posted @ 2017-07-19 22:02 Life·Intelligence 阅读(9792) 评论(0) 推荐(0) 编辑
摘要: 业界良心啊,开源的单细胞课程。 随便看了几章,课程写得非常用心,非常适合新手。 课程地址:Analysis of single cell RNA-seq data 源码地址:hemberg-lab/scRNA.seq.course 阅读全文
posted @ 2017-07-13 10:56 Life·Intelligence 阅读(2035) 评论(0) 推荐(1) 编辑
摘要: 本文总结自一篇综述: Computational approaches for interpreting scRNA-seq data 单细胞分析分为两个层次: cell level gene level Tools for the visualization and clustering of cells. Tools for the ordering of cells & bifurca... 阅读全文
posted @ 2017-07-12 18:13 Life·Intelligence 阅读(8069) 评论(0) 推荐(0) 编辑
摘要: PhiX Control v3 is a reliable, adapter-ligated library used as a control for Illumina sequencing runs. The library is derived from the small, well-characterized PhiX genome, offering several benefits ... 阅读全文
posted @ 2017-07-12 09:56 Life·Intelligence 阅读(739) 评论(0) 推荐(0) 编辑
摘要: 小提琴图现在比较流行,在文章里很常见。 【小提琴图】其实是【箱线图】与【核密度图】的结合,【箱线图】展示了分位数的位置,【小提琴图】则展示了任意位置的密度,通过【小提琴图】可以知道哪些位置的密度较高。 实例解析 在上图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计(在概率论中用来估计未知的密度函数,属于非参数检验方法之一)。 数据化分析解读:... 阅读全文
posted @ 2017-07-11 17:28 Life·Intelligence 阅读(16683) 评论(0) 推荐(0) 编辑
摘要: ERCC是啥? 外部RNA控制联盟,就是一套RNA-seq,基因表达检测过程中的控制系统,使得结果具有可重复性。 RNA Spike-in Controls for Gene Expression While early gene expression measurements with DNA microarrays were groundbreaking in their ability to... 阅读全文
posted @ 2017-07-11 17:14 Life·Intelligence 阅读(1897) 评论(0) 推荐(0) 编辑
摘要: mRNA是由DNA的一条链转录而来的(可以是正链,也可以是反链),DNA是由非编码区和编码区组成,编码区也有其特殊的结构,主要有外显子和内含子组成。 mRNA的一个重要性质就是可变剪切,也就是同一个编码区,可能会有不同的外显子组合。 mRNA的结构:5’端的帽子结构和3’端的polyA尾巴。 polyA和oligo(dT)是什么?它在mRNA纯化和反转录中有什么作用? 传统mRNA差异显示技术(D... 阅读全文
posted @ 2017-07-11 15:01 Life·Intelligence 阅读(2409) 评论(0) 推荐(0) 编辑
摘要: 最近在搞16S,发现了一个实践算法的最佳机会。 见文章: A Bayesian taxonomic classification method for 16S rRNA gene sequences with improved species-level accuracy. 文章利用了贝叶斯模型,调用了blast和muscle来对OTU进行taxonomy assignment。 可以看一下源代... 阅读全文
posted @ 2017-07-10 16:58 Life·Intelligence 阅读(1654) 评论(0) 推荐(0) 编辑
摘要: 杰卡德距离(Jaccard Distance) 是用来衡量两个集合差异性的一种指标,它是杰卡德相似系数的补集,被定义为1减去Jaccard相似系数。而杰卡德相似系数(Jaccard similarity coefficient),也称杰卡德指数(Jaccard Index),是用来衡量两个集合相似度的一种指标。 Jaccard相似指数用来度量两个集合之间的相似性,它被定义为两个集合交集的元素个数除... 阅读全文
posted @ 2017-07-03 11:07 Life·Intelligence 阅读(1606) 评论(0) 推荐(0) 编辑
上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 38 下一页
TOP