07 2018 档案
摘要:目录 3.1学习编程的不同方法 3.2编辑-运行-修正(还有保存) 3.3编程文化 3.4编程策略 3.5编程过程 本章将概述程序员是如何完成他们的任务的。如果你已经安装了Python,而且想立即编写生物信息学中的实用程序,可以跳过本章直接阅读第4章。 初进生物学实验室的人对各种试管仪器会有一种莫名
阅读全文
摘要:目录 2.1低而长的学习曲线 2.2Python的优势 2.3在你的计算机中安装Python 2.4如何运行Python程序 2.5文本编辑器 2.6寻求帮助 Python语言是一种流行的编程语言,在生物信息学和网络编程中广泛应用。Python之所以能被生物学家广泛使用,是因为它特别适合用来解决生物
阅读全文
摘要:1. 基因转录本亚型 蛋白质亚型或“蛋白质变体“是一组高度相似的蛋白质成员,这些成员来源于单个基因或基因家族,是遗传差异造成的结果。虽然许多具有相同或相似的生物学作用,但一些亚型具有独特的功能。这些高度相似的蛋白质亚型可以由可变剪切(图1)、可变启动子或单基因的其他转录后修饰形成,通常不考虑翻译后修
阅读全文
摘要:目录 1.1DNA的组成 1.2蛋白质的组成 1.3In Silico 1.4计算的局限 涉足计算机程序设计和生物学领域,总会发现有许多激动人心的事情,随处可⻅的新技术和新成果便是其中之一。 当然,生物学是一⻔古老的学科,但其中许多有趣的研究方向都源于新技术和新想法。现代科学中的遗传学起源于广受赞誉
阅读全文
摘要:什么是生物信息学? 生物学数据正在⻜速增⻓。一段时间一来,GenBank和PDB(Protein Data Bank)等公共数据库都在以指数级别增⻓。随着万维网(World Wide Web)的到来,以及快速的网络连接,在世界上的任意一个地方,都可以快速、简便且廉价地获取到这些数据库中的数据和大量具
阅读全文
摘要:建造者模式将一个复杂对象的构造过程与其表现分离,这样,同一个构造过程可用于创建多个不同的表现。 我们来看个实际的例子,假设我们想要创建一个HMTL页面生成器,HTML页面的基本结构(构造组件)通常是一样的:以<html>开始</html>结束,在HTML部分中有<head>和</head>元素,在h
阅读全文
摘要:在工厂设计模式中,客户端可以请求一个对象,而无需知道这个对象来自哪里;也就是,使用哪个类类生成这个对象。工厂背后的思想是简化对象的创建。与客户端自己基于类实例化直接创建对象相比,基于一个中心化函数来实现,更易于追踪创建了哪些对象。通过将创建对象的代码和使用对象的代码解耦,工厂能够降低应用维护的复杂度
阅读全文
摘要:annovar软件组件介绍之一——table_annovar.pl(译) 对于初学者,使用ANNOVAr的最简单方法是使用table_annovar.pl程序,该程序采用输入突变文件(例如,VCF文件)并生成带有多个制表符分隔的输出文件,每个列表示一组注释。另外,如果输入是VCF文件,则程序还生成新
阅读全文
摘要:以下是对Ensembl突变数据库中储存的数据的描述,对于Ensembl数据库中不同的物种,我们从各种来源(例如,dbSNP数据库)导入突变数据(SNP、CNV、等位基因频率、基因型等),导入的突变数据和等位基因经过质量控制过程来标记可疑数据。 我们将突变分成几个不同的类,并计算突变的预测结果,并且我
阅读全文
摘要:在基因注释时,难免碰到各种GENE在不同数据库之间的ID转换(例如,Ensembl ID 转Entrez ID,或者Entrez ID与GENE Symbol之间的转换)。这里介绍一下常用的三个在线网站, DAVID、bioDBnet、Ensembl Biomart, DAVID访问太慢,Ensem
阅读全文
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Date : 2018-06-11 09:35:49 # @Author : Yaheng Wang (m13262578991@163.com) # @Link : http://www.wy2160640.github.io # @Version : $Id$ import...
阅读全文
摘要:在指定路径下,搜索Excel文件中包含的指定内容,首先需要遍历指定路径,得到该路径下所有Excel文件的绝对/相对路径;然后读取Excel中内容,将文件中的每个单元格的值与要搜索的内容进行判断(正则比较,等值比较)。因此,实现该功能需要完成两部分内容,路径遍历和Excel文件内容读取。 使用os模块
阅读全文
摘要:在生物信息学分析中,经常对DNA序列进行一系列操作,包括子序列截取,互补序列获取,反向序列获取,反向互补序列获取。在python语言中,可编写如下函数完成这些简单功能。 子序列截取 python中对序列截取使用字符串切片功能就可以完成,例如: 注意,切片操作是“0-base”的,包左不包右。 互补序
阅读全文
摘要:PandaSeq安装 $ ./autogen.sh && ./configure && make && sudo make install PandaSeq安装报错 PandaSeq install error: ltld required, install libtool library解决方法
阅读全文
摘要:Ensemble公共MySQL数据库 对于大量数据和更详细的分析,Ensemble的MySQL服务器ensembldb.ensembl.org,useastdb.ensembl.org或asiadb.ensembl.org,可以以匿名方式访问。 第三台服务器martdb.ensembl.org提供对
阅读全文
摘要:1.python安装 我的电脑是32位的,安装了Python 3.5.4版本其它安装版本 2.python环境变量配置 将”C:\Program Files\Python35",”C:\Program Files\Python35\Scripts”(视具体python安装路径添加)添加进环境变量pa
阅读全文
摘要:vcf格式示例 ##fileformat=VCFv4.1 ##FILTER=<ID=LowQual,Description=”Low quality”> ##FORMAT=<ID=AD,Number=.,Type=Integer,Description=”Allelic depths for the
阅读全文
摘要:primer3是由怀特黑德生物医学研究所Steve Rozen等人发起的一个自动寡核苷酸分析和设计的开源项目,被广泛应用在分子生物领域。primer3-py是用python语言封装的primer3的API,官方推荐安装linux,mac平台,如何在windows平台下安装呢? 阅读primer3-p
阅读全文
摘要:pysam模块 因为要分析sam文件中序列的情况,因此要对reads进行细分,所以之前想用数据库将sam文件信息存储,然后用sql语句进行分类。后来发现很麻烦,pysam就是一个高效读取存储在SAM / BAM / CRAM格式文件中的映射短读序列数据信息的python模块,可以轻松地对reads进
阅读全文
摘要:简介 SRA数据库是美国国立卫生研究院(NIH)的高通量测序数据的主要归档,是国际核苷酸序列数据库协作(INSDC)的一部分,其中包括NCBI序列读取存档(SRA),欧洲生物信息学研究所(EBI)和DNA数据库 日本(DDBJ)。 提交给三个组织中的任何一个的数据都是共享的。 SRA数据库数据来自高
阅读全文
摘要:一、BED 文件格式 BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。 每行的数据格式要求一致。 必须包含的3列: 1.chrom, 染色体名字(e.g. chr3, chrY) 2.chromStart, 目标区段在染色体起始位置
阅读全文
摘要:UCSC Genome Browser是由University of California Santa Cruz (UCSC) 创立和维护的,该站点包含有人类、小鼠和大鼠等多个物种的基因组草图和注释信息,并提供一系列的网页分析工具。 1.MySQL安装 本人使用的是Centos6.8系统,推荐使用y
阅读全文