上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 38 下一页
摘要: 最近想做一个数据库网站,我对Python很熟悉,也了解到Django很好用,于是说搞就搞。 首先,在快云上买了一个vps,一元试用一个月,Ubuntu系统。 1.安装Django apt-get update apt-get install python-pip python-dev build-essential python -m pip install django 安装的方法很多,可以自由... 阅读全文
posted @ 2017-06-17 02:15 Life·Intelligence 阅读(1519) 评论(0) 推荐(0) 编辑
摘要: 微生物16S的OTU聚类工具有很多,最常用的就是 usearch、cdhit-OTU、mothur。 这些工具大多都是针对二代测序平台的,usearch的64bit版本是收费的。 如果要跑PacBio的OTU聚类,目前就只能用 mothur 了。 mothur有着非常详细的说明文档! General operations Sequence processing OTU-based approac... 阅读全文
posted @ 2017-06-09 15:40 Life·Intelligence 阅读(6580) 评论(0) 推荐(0) 编辑
摘要: 一个有效的数据降维的方法 t-SNE,类似PCA的主成分降维分析。 参考: t-分布邻域嵌入算法(t-SNE algorithm)简单理解 t-SNE初学 很好的教程:An illustrated introduction to the t-SNE algorithm 有点复杂额 阅读全文
posted @ 2017-05-26 16:40 Life·Intelligence 阅读(2053) 评论(0) 推荐(1) 编辑
摘要: 单细胞流程跑了不少,但依旧看不懂结果,是该好好补补了。 有些人可能会误会,觉得单细胞的RNA-seq数据很好分析,跟分析常规的RNA-seq应该没什么区别。今天的这篇文章2015年3月发表在Nature Genetics Review上,专门说明了一下单细胞RNA测序数据在数据分析和计算上的挑战(虽然已经过去1年多了,这里指出的问题和挑战仍然是不过时的,至于这些问题和挑战现在是不是完美解决了,... 阅读全文
posted @ 2017-05-26 16:06 Life·Intelligence 阅读(16497) 评论(0) 推荐(1) 编辑
摘要: 10X Genomics已经广泛应用于单细胞测序、组装领域,现在也是火的不行。 10X Genomics原理 通过将来自相同DNA片段(10-100kb)的reads加上相同的barcode,然后在illumina平台上进行测序,从而实现长片段的测序。其基本原理是同一长片段的reads会具有同样的标 阅读全文
posted @ 2017-05-26 14:49 Life·Intelligence 阅读(6426) 评论(0) 推荐(0) 编辑
摘要: 最开始学的就是C和C++,但只是学过,根本就不知道怎么使用。 后来接触了Python和Perl才知道怎么将编程应用于实际需求当中,读取文件,存放到数据结构,处理,输出。 但脚本语言有其固有的缺点,不能用于高速计算。 生物信息的基础是大数据(G~T级别),我们不仅要优化算法,还得选择接近底层的语言,那显然就必须要用到C和C++了,Java都不够快。 现在我接触了一个CNV的C++写的程序,看了源码,... 阅读全文
posted @ 2017-04-17 23:55 Life·Intelligence 阅读(612) 评论(0) 推荐(0) 编辑
摘要: 使用软件 CNVnator_v0.3.2 过滤脚本 cnvnator_filter.pl CNV输出结果 CNV_type coordinates CNV_size normalized_RD p-val1 p-val2 p-val3 p-val4 q0 duplication chr10:1-9590600 9.5906e+06... 阅读全文
posted @ 2017-03-31 10:43 Life·Intelligence 阅读(1398) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2017-03-27 10:00 Life·Intelligence 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 持续更新~ 散点图 条形图 文氏图 饼图 盒型图 频率直方图 热图 PCA图 3D图 火山图 分面图 分面制作小多组图 地图 练习数据: year count china Ame jap '12 2.800000 1.500000 4.500000 2.500000 '13 2.941956 1.587559 5.342547 2.814862 '14 3.508838 1.648... 阅读全文
posted @ 2017-03-22 20:39 Life·Intelligence 阅读(4413) 评论(0) 推荐(0) 编辑
摘要: The Greengenes Database Release 13_5 这是16S的一个非常重要的数据库 The Greengenes Database, a public resource since 2002 (DeSantis 2003, DeSantis 2006, McDonald 2011), is a well-characterized and curated databas... 阅读全文
posted @ 2017-02-23 17:10 Life·Intelligence 阅读(4194) 评论(0) 推荐(1) 编辑
摘要: 如何下载NCBI blast数据库? 有哪些可供下载的blast数据库? blast如何使用? blast构建索引 | makeblastdb -in 后接输入文件,你要格式化的fasta序列-dbtype 后接序列类型,nucl为核酸,prot为蛋白-title 给数据库起个名,好看~~(不能用在 阅读全文
posted @ 2017-02-21 18:38 Life·Intelligence 阅读(44362) 评论(0) 推荐(0) 编辑
摘要: An enterotype is a classification of living organisms based on its bacteriological ecosystem in the gut microbiome. 相关经典文章:Enterotypes of the human gut microbiome 待续~ 在近几年里,科学家们在被我们称作人体微生物生态组(mi... 阅读全文
posted @ 2017-02-21 18:36 Life·Intelligence 阅读(2916) 评论(0) 推荐(0) 编辑
摘要: 1、人类基因组的HapMap和国际HapMap计划 (1)何谓HapMap HapMap是Haplotype Map 的简称,Haplo意为单一,在基因组中专指来自父母的一对染色体中的一条。Haplotype就是单条染色体中的一段,译作单体型(有人译作单倍型),是描述遗传差异的一种主要方式。DNA作为遗传物质,不但编码了物种间的差异,物种内不同个体之间的差异也含在其中,均表现为基因组之间的DN... 阅读全文
posted @ 2017-02-20 16:37 Life·Intelligence 阅读(6201) 评论(0) 推荐(0) 编辑
摘要: 主流工具: FastQC fqcheck readfq 拿到测序数据的第一步就是做质量控制 fqcheck之后得到的结果: 它会统计每条reads,按read 1-100位点计算每个位置的ACGTN含量,以及0-41质量值的个数 最终会得到整体的错误率,GC,Q20,Q30 the default quality shift value is: -64, ... 阅读全文
posted @ 2017-02-20 11:56 Life·Intelligence 阅读(7578) 评论(0) 推荐(0) 编辑
摘要: 最早就是写Perl的,后来来到公司转Python,现在又要负责流程了,开始重拾Perl,当然是借鉴别人现有的语法,我再重新组合。 基本语法就不介绍了,参照我之前文章 Perl 模块 use strict; use File::Path; 【Perl】Path::File 目录的创建和删除 内置模块,导入之后就可以随时创建和删除目录了,mkpath("LZX"... 阅读全文
posted @ 2017-02-17 14:39 Life·Intelligence 阅读(2470) 评论(0) 推荐(0) 编辑
摘要: 大家基本都知道什么是 FASTA 和 FastQ 格式了,但这是不够的。 我们还需要了解世界上最大的测序公司自己定制的 FastQ 格式,因为你可能会经常用到,有时还会亲自去处理它们。 本文主题:Illumina 测序数据中的 Index Fastq格式详解 @FCHCGKFBCXY:1:1101:1110:2162#AACAGCACCTAGCA_GTAGTGCG/1 ATGTATA... 阅读全文
posted @ 2017-02-16 19:38 Life·Intelligence 阅读(3504) 评论(0) 推荐(0) 编辑
摘要: 参考: 分子生物学教材 再一次,翻看真核生物基因结构! mRNA基本结构特点 Structure and function of Messenger RNA (mRNA ) 基因结构 其实这个结构不完整,完整的如下: 主要注意UTR这个结构 真核生物的基因结构包括编码区和非编码区。 编码区 编码区其实是断裂基因结构,也就是不连续基因。具有蛋白编码... 阅读全文
posted @ 2017-02-16 10:51 Life·Intelligence 阅读(21596) 评论(0) 推荐(0) 编辑
摘要: 如果你的职业定位是数据分析师/计算生物学家,那么不懂PCA、t-SNE的原理就说不过去了吧。跑通软件没什么了不起的,网上那么多教程,copy一下就会。关键是要懂其数学原理,理解算法的假设,适合解决什么样的问题。 学习可以高效,但却没有捷径,你终将为自己的思维懒惰和行为懒惰买单。 PCA的原理和普通实 阅读全文
posted @ 2017-02-16 10:49 Life·Intelligence 阅读(70422) 评论(0) 推荐(4) 编辑
摘要: 问题: 三代基因编辑的技术特点是什么?具体机制是什么?技术起源? DSB和DSR是什么?核酸酶发挥着什么作用? CRISPR是如何在细菌中发现的?细菌是如何实现自我免疫的?有哪些关键元件?spacer DNA是什么?crDNA是什么? 理解CRISPR的每一个词是什么意思 CRISPR是如何被改造, 阅读全文
posted @ 2017-02-16 10:06 Life·Intelligence 阅读(1631) 评论(0) 推荐(0) 编辑
摘要: hs.TFs <- read.csv("https://github.com/leezx/RToolbox/raw/master/data/Homo_sapiens_TF.txt", sep = "\t") hs.coTFs <- read.csv("https://github.com/leezx 阅读全文
posted @ 2017-02-15 19:36 Life·Intelligence 阅读(5276) 评论(0) 推荐(0) 编辑
上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 38 下一页
TOP