02 2017 档案
摘要:http://blog.sina.com.cn/s/blog_b2f983a50102yexs.html 当我们在pythonwin中创建多个变量后,通过dir()函数,可以看到所有已创建变量,这些已经创建的变量会保存在globals全局中,如果想快速删除可以使用如下脚本:阿弥陀佛,哈哈。 1、脚本
阅读全文
摘要:Peptide Sequence Databases蛋白序列的数据库 nrAll non-redundant GenBank CDS translations + RefSeq Proteins + PDB + SwissProt + PIR + PRF所有非冗余的的GenBank CDS区的翻译序
阅读全文
摘要:20170222 ANNOVAR简介 ANNOVAR是由王凯编写的一个注释软件,可以对SNP和indel进行注释,也可以进行变异的过滤筛选。 ANNOVAR能够利用最新的数据来分析各种基因组中的遗传变异。主要包含三种不同的注释方法,Gene-based Annotation(基于基因的注释)、Reg
阅读全文
摘要:pprint – 美观打印 作用:美观打印数据结构 pprint 包含一个“美观打印机”,用于生成数据结构的一个美观视图。格式化工具会生成数据结构的一些表示,不仅可以由解释器正确地解析,而且便于人类阅读。输出尽可能放在一行上,分解为多行时则需要缩进。 以下实例用用到的data包含一下数据 data
阅读全文
摘要:每个人一生中都会遇到一件事情,在事情出现之前不会关心,但是事情一旦来临就发现它极其重要,并且需要在很短的时间内做出重大决定,那就是给自己的新生宝宝起个名字。 因为要在孩子出生后两周内起个名字(需要办理出生证明了),估计很多人都像我一样,刚开始是很慌乱的,虽然感觉汉字非常的多随便找个字做名字都行,后来
阅读全文
摘要:转载自http://www.zilhua.com 在本博客中,所有的软件安装都在服务器上,且无root权限。理论上适合所有的用户。 我的安装目录 cd /home/zilhua/software 1、在官方网站下载新版本的源码包: http://www.perl.org/get.html,版本自己选
阅读全文
摘要:转载自http://www.zilhua.com 在本博客中,所有的软件安装都在服务器上,且无root权限。理论上适合所有的用户。 我的安装目录 cd /home/zilhua/software 1、在官方网站下载新版本的源码包: http://www.perl.org/get.html,版本自己选
阅读全文
摘要:1、 http://blog.sciencenet.cn/home.php?mod=space&uid=1469385&do=blog&classid=166694&view=me&from=space [转载]如何使用SnpEff 对SNP结果进行分析 [转载]基因组变异检测概述 :重要要看看 [
阅读全文
摘要:http://blog.163.com/bioinfor_cnu/blog/static/19446223720118205527863/ 所有文章:http://blog.163.com/bioinfor_cnu/blog/#m=0 1. 成对HMM用于双序列比对的基本思想: 2. 状态转移矩阵:
阅读全文
摘要:1) 文件内全部替换: :%s#abc#123#g (如文件内有#,可用/替换,:%s/abc/123/g) --注:把abc替换成123 (或者: %s/str1/str2/g 用str2替换文件中所有的str1) 2) 文件内局部替换: :20,30s#abc#123(如文件内有#,可用/替换,
阅读全文
摘要:http://blog.sina.com.cn/s/blog_72208a6a0101cdt1.html http://www.docin.com/p-350677620.html http://wenku.baidu.com/view/9bd89b7e31b765ce050814d5.html 在
阅读全文
摘要:微生物生态(MicrobialEcology),又名环境微生物(Environmental Microbiology),是研究微生物之间及其与环境之间相互关系的学科。从生物角度,其研究对象主要有真核微生物(Eukaryotes,如原生生物、真菌等)、原核微生物(Prokaryotes,细菌和古菌)和
阅读全文
摘要:sliva rRNA数据库(http://www.arb-silva.de/)用来检查和比对RNA序列,既可以针对16S/18S,SSU,也可以针对23S/28S, LSU,包括了Bacteria, Archaea and Eukarya。同时也是ARB的官方指定数据库。 LSU: Large su
阅读全文
摘要:http://www.ncbi.nlm.nih.gov/pubmed/26635391
阅读全文
摘要:http://www.lncrnablog.com/
阅读全文
摘要:1.胞外囊泡数据库(EVpedia) 数据库链接:http://evpedia.info 胞外囊泡的分泌是一种普遍的细胞活动这种活动的物种范围从单细胞生物(如古细菌;革兰氏阳性和革兰氏阴性菌)到复杂的多细胞生物体,这些信息表明胞外囊泡调节的细胞间通讯在进化上是保守的。胞外囊泡是一种球状脂质双分子层,
阅读全文
摘要:如果你获得了一个肿瘤差异表达基因,想研究其是否可作为某种肿瘤的潜在标志物和靶点,又怕做实验会得到阴性结果,浪费时间和金钱,这时候你就应该想到Oncomine数据库了(www.oncomine.org)。 Oncomine整合了GEO、TCGA和已发表的文献等来源的RNA和DNA-seq数据,只要你用
阅读全文
摘要:环状RNA(circRNA)研究技术手册.doc.pdf (转自:汉恒生物)
阅读全文
摘要:在自己的研究工作中,经常会遇到一些需要对Gene ID进行转换的情况。目前存在着大量的生物信息数据库,每个数据库都有自己定义的ID命名规则,转换起来实在是一个很大的工作。举个例子,之前构建的Human PPI network, 共选用相关数据库有6个,其中对于蛋白的命名相关的形式多达近10中,耗费了
阅读全文
摘要:1.miRbasehttp://www.mirbase.org/2.miRDBhttp://www.mirdb.org/miRDB/policy.html3.miRandahttp://www.microrna.org/microrna/home.do4.TargetScanhttp://www.t
阅读全文
摘要:by Umer Zeeshan Ijaz The purpose of this tutorial is to introduce students to the frequently used tools for NGS analysis as well as giving experience
阅读全文
摘要:转载自:http://blog.sciencenet.cn/blog-1509670-1000479.html 随着芯片和高通量测序技术的广泛应用,在肿瘤研究领域积累了越来越多的基因组学数据,特别是像The Cancer Genome Atlas(TCGA)、International Cancer
阅读全文
摘要:http://bioinformatics.mdanderson.org/main/Main_Page http://ibl.mdanderson.org/tanric/_design/basic/index.html
阅读全文
摘要:如同这个数据结构的名称所说的那样,它记录了每个键值对添加的顺序。 ? 1 2 3 4 5 6 d = OrderedDict() d['a'] = 1 d['b'] = 10 d['c'] = 8 for letter in d: print letter ? 1 2 3 4 5 6 d = Ord
阅读全文
摘要:python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set
阅读全文
摘要:chr()、unichr()和ord() chr()函数用一个范围在range(256)内的(就是0~255)整数作参数,返回一个对应的字符。unichr()跟它一样,只不过返回的是Unicode字符,这个从Python 2.0才加入的unichr()的参数范围依赖于你的Python是如何被编译的。
阅读全文
摘要:1、有两种方法:1. use Cwd;my $dir = getcwd;#$dir中即为当前目录的完整路径信息。2. my $dir = $ENV{'PWD'};#ENV是一个散列,用于存放环境变量。PWD是Linux的环境变量,表示当前所在目录。 my $path=`pwd`;print $pat
阅读全文
摘要:command_line = ("{7} {0} -Xmx{1} -jar {2} -T Pileup -R {3} -I {4} -L {5} -o {6} " + "-verbose -rf DuplicateRead --filter_reads_with_N_cigar " + "--fil
阅读全文
摘要:python从2.6开始支持format,新的更加容易读懂的字符串格式化方法, 从原来的% 模式变成新的可读性更强的 综合举例说明: 输入: '{:>18,.2f}'.format(70305084.0) # :冒号+空白填充+右对齐+固定宽度18+浮点精度.2+浮点数声明f 输出:' 70,305
阅读全文
摘要:我们想要用Python获得一些有关系统的各种信息的时候就不得不想到os的environ,那这里面都具体包含了那些内容呢? 一、简介 对于官方的解释,environ是一个字符串所对应环境的映像对象。这是什么意思呢?举个例子来说,environ['HOME']就代表了当前这个用户的主目录。 下图是win
阅读全文
摘要:#!/usr/bin/perl#perl search.pl --infile Targets.Lung.Carcinoma.genelist.txt --homogene Homo_sapiens.gene_info --outfile Targets.Lung.Carcinoma.geneID.
阅读全文
摘要:标题写了那么久,现在现在才有时间,整理下自己的思路。首先先总结下自己对sys模块的理解。手册上对sys的描述是系统参数和系统函数,这里的系统实际上是python解释器。这个模块提供了用户可以访问的解释器变量和一些可以与解释器进行交互的功能函数。这里主要关注的就是sys.argv,其实它就是一个解释器
阅读全文
摘要:(一)通过vi编辑器来替换。vi/vim 中可以使用 :s 命令来替换字符串。:s/well/good/ 替换当前行第一个 well 为 good:s/well/good/g 替换当前行所有 well 为 good:n,$s/well/good/ 替换第 n 行开始到最后一行中每一行的第一个 wel
阅读全文
摘要:cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。 (1)其语法格式为:cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file] 使用说明cut 命令从文件的每一行剪切
阅读全文
摘要:enumerate()说明 enumerate()是python的内置函数 enumerate在字典上是枚举、列举的意思 对于一个可迭代的(iterable)/可遍历的对象(如列表、字符串),enumerate将其组成一个索引序列,利用它可以同时获得索引和值 enumerate多用于在for循环中得
阅读全文
摘要:1.在Python中,通常有这几种方式来表示时间:1)时间戳 2)格式化的时间字符串 3)元组(struct_time)共九个元素。由于Python的time模块实现主要调用C库,所以各个平台可能有所不同。2.UTC(Coordinated Universal Time,世界协调时)亦即格林威治天文
阅读全文
摘要:一、subprocess以及常用的封装函数运行python的时候,我们都是在创建并运行一个进程。像Linux进程那样,一个进程可以fork一个子进程,并让这个子进程exec另外一个程序。在Python中,我们通过标准库中的subprocess包来fork一个子进程,并运行一个外部的程序。subpro
阅读全文
摘要:SAM是Sequence Alignment/Map 的缩写。像bwa等软件序列比对结果都会输出这样的文件。samtools网站上有专门的文档介绍SAM文件。具体地址:http://samtools.sourceforge.net/SAM1.pdf 很多人困惑SAM文件中的第二列FLAG值是什么意思
阅读全文
摘要:在SAM输出的结果中每一行都包括十二项通过Tab分隔,从左到右分别是: 1 序列的名字(Read的名字) 2 概括出一个合适的标记,各个数字分别代表 1 序列是一对序列中的一个 2 比对结果是一个pair-end比对的末端 4 没有找到位点 8 这个序列是pair中的一个但是没有找到位点 16 在这
阅读全文
摘要:https://github.com/samtools/hts-specs
阅读全文
摘要:一.rename解决 1. Ubuntu系统下 rename 's//.c//.h/' ./* 把当前目录下的后缀名为.c的文件更改为.h的文件 2. CentOS5.5系统下 rename .c .h *.c 把当前目录下的后缀名为.c的文件更改为.h的文件 二.shell 脚本解决 #!/bin
阅读全文