随笔档案「2018年7月」 - 青蛙快飞

第 3 章编程的艺术

摘要：目录 3.1学习编程的不同方法 3.2编辑-运行-修正（还有保存） 3.3编程文化 3.4编程策略 3.5编程过程本章将概述程序员是如何完成他们的任务的。如果你已经安装了Python，而且想立即编写生物信息学中的实用程序，可以跳过本章直接阅读第4章。初进生物学实验室的人对各种试管仪器会有一种莫名阅读全文

posted @ 2018-07-27 21:00 青蛙快飞阅读(234) 评论(0) 推荐(0)

第 2 章 Python 语言入⻔

摘要：目录 2.1低而长的学习曲线 2.2Python的优势 2.3在你的计算机中安装Python 2.4如何运行Python程序 2.5文本编辑器 2.6寻求帮助 Python语言是一种流行的编程语言，在生物信息学和网络编程中广泛应用。Python之所以能被生物学家广泛使用，是因为它特别适合用来解决生物阅读全文

posted @ 2018-07-26 16:38 青蛙快飞阅读(359) 评论(0) 推荐(0)

获取基因的所有转录本（不同亚型）的外显子区域

摘要：1. 基因转录本亚型蛋白质亚型或“蛋白质变体“是一组高度相似的蛋白质成员，这些成员来源于单个基因或基因家族，是遗传差异造成的结果。虽然许多具有相同或相似的生物学作用，但一些亚型具有独特的功能。这些高度相似的蛋白质亚型可以由可变剪切（图1）、可变启动子或单基因的其他转录后修饰形成，通常不考虑翻译后修阅读全文

posted @ 2018-07-24 17:01 青蛙快飞阅读(16143) 评论(0) 推荐(0)

第 1 章生物学和计算机科学

摘要：目录 1.1DNA的组成 1.2蛋白质的组成 1.3In Silico 1.4计算的局限涉足计算机程序设计和生物学领域，总会发现有许多激动人心的事情，随处可⻅的新技术和新成果便是其中之一。当然，生物学是一⻔古老的学科，但其中许多有趣的研究方向都源于新技术和新想法。现代科学中的遗传学起源于广受赞誉阅读全文

posted @ 2018-07-24 10:41 青蛙快飞阅读(1255) 评论(0) 推荐(0)

前言

摘要：什么是生物信息学？生物学数据正在⻜速增⻓。一段时间一来，GenBank和PDB（Protein Data Bank）等公共数据库都在以指数级别增⻓。随着万维网（World Wide Web）的到来，以及快速的网络连接，在世界上的任意一个地方，都可以快速、简便且廉价地获取到这些数据库中的数据和大量具阅读全文

posted @ 2018-07-23 20:29 青蛙快飞阅读(298) 评论(0) 推荐(0)

（转自精通Python设计模式）Python设计模式之创建型模式——2.建造者模式

摘要：建造者模式将一个复杂对象的构造过程与其表现分离，这样，同一个构造过程可用于创建多个不同的表现。我们来看个实际的例子，假设我们想要创建一个HMTL页面生成器，HTML页面的基本结构（构造组件）通常是一样的：以<html>开始</html>结束，在HTML部分中有<head>和</head>元素，在h 阅读全文

posted @ 2018-07-20 20:32 青蛙快飞阅读(269) 评论(0) 推荐(0)

（转自精通Python设计模式）Python设计模式之创建型模式——1.工厂模式

摘要：在工厂设计模式中，客户端可以请求一个对象，而无需知道这个对象来自哪里；也就是，使用哪个类类生成这个对象。工厂背后的思想是简化对象的创建。与客户端自己基于类实例化直接创建对象相比，基于一个中心化函数来实现，更易于追踪创建了哪些对象。通过将创建对象的代码和使用对象的代码解耦，工厂能够降低应用维护的复杂度阅读全文

posted @ 2018-07-20 08:52 青蛙快飞阅读(320) 评论(0) 推荐(0)

ANNOVAR工具

摘要：annovar软件组件介绍之一——table_annovar.pl（译）对于初学者，使用ANNOVAr的最简单方法是使用table_annovar.pl程序，该程序采用输入突变文件（例如，VCF文件）并生成带有多个制表符分隔的输出文件，每个列表示一组注释。另外，如果输入是VCF文件，则程序还生成新阅读全文

posted @ 2018-07-18 21:07 青蛙快飞阅读(3412) 评论(0) 推荐(0)

Ensembl突变数据描述之（一）——突变物种数据库及预测工具

摘要：以下是对Ensembl突变数据库中储存的数据的描述，对于Ensembl数据库中不同的物种，我们从各种来源（例如，dbSNP数据库）导入突变数据（SNP、CNV、等位基因频率、基因型等），导入的突变数据和等位基因经过质量控制过程来标记可疑数据。我们将突变分成几个不同的类，并计算突变的预测结果，并且我阅读全文

posted @ 2018-07-18 21:04 青蛙快飞阅读(2027) 评论(0) 推荐(0)

geneid/genesymbol/ensemblid等之间的转换

摘要：在基因注释时，难免碰到各种GENE在不同数据库之间的ID转换（例如，Ensembl ID 转Entrez ID，或者Entrez ID与GENE Symbol之间的转换）。这里介绍一下常用的三个在线网站， DAVID、bioDBnet、Ensembl Biomart， DAVID访问太慢，Ensem 阅读全文

posted @ 2018-07-18 21:03 青蛙快飞阅读(6712) 评论(0) 推荐(0)

使用python ftplib包递归下载文件夹及文件

摘要：#!/usr/bin/env python # -*- coding: utf-8 -*- # @Date : 2018-06-11 09:35:49 # @Author : Yaheng Wang (m13262578991@163.com) # @Link : http://www.wy2160640.github.io # @Version : $Id$ import... 阅读全文

posted @ 2018-07-18 21:02 青蛙快飞阅读(892) 评论(0) 推荐(0)

使用python内置模块os和openpyxl搜索指定文件夹下Excel中的内容

摘要：在指定路径下，搜索Excel文件中包含的指定内容，首先需要遍历指定路径，得到该路径下所有Excel文件的绝对/相对路径；然后读取Excel中内容，将文件中的每个单元格的值与要搜索的内容进行判断（正则比较，等值比较）。因此，实现该功能需要完成两部分内容，路径遍历和Excel文件内容读取。使用os模块阅读全文

posted @ 2018-07-18 21:00 青蛙快飞阅读(3984) 评论(0) 推荐(0)

python实现DNA序列字符串转换，互补链，反向链，反向互补链

摘要：在生物信息学分析中，经常对DNA序列进行一系列操作，包括子序列截取，互补序列获取，反向序列获取，反向互补序列获取。在python语言中，可编写如下函数完成这些简单功能。子序列截取 python中对序列截取使用字符串切片功能就可以完成，例如：注意，切片操作是“0-base”的，包左不包右。互补序阅读全文

posted @ 2018-07-18 20:59 青蛙快飞阅读(7341) 评论(0) 推荐(0)

PandaSeq安装报错ltld required, install libtool library

摘要：PandaSeq安装 $ ./autogen.sh && ./configure && make && sudo make install PandaSeq安装报错 PandaSeq install error: ltld required, install libtool library解决方法阅读全文

posted @ 2018-07-18 20:55 青蛙快飞阅读(700) 评论(0) 推荐(0)

使用MySQL客户端登录Ensemble数据库查询相关信息

摘要：Ensemble公共MySQL数据库对于大量数据和更详细的分析，Ensemble的MySQL服务器ensembldb.ensembl.org，useastdb.ensembl.org或asiadb.ensembl.org，可以以匿名方式访问。第三台服务器martdb.ensembl.org提供对阅读全文

posted @ 2018-07-18 20:54 青蛙快飞阅读(750) 评论(0) 推荐(0)

Windows上python + selenium + Firefox浏览器的环境配置

摘要：1.python安装我的电脑是32位的，安装了Python 3.5.4版本其它安装版本 2.python环境变量配置将”C:\Program Files\Python35",”C:\Program Files\Python35\Scripts”(视具体python安装路径添加)添加进环境变量pa 阅读全文

posted @ 2018-07-18 20:52 青蛙快飞阅读(710) 评论(0) 推荐(0)

VCF文件处理工具PyVCF

摘要：vcf格式示例 ##fileformat=VCFv4.1 ##FILTER=<ID=LowQual,Description=”Low quality”> ##FORMAT=<ID=AD,Number=.,Type=Integer,Description=”Allelic depths for the 阅读全文

posted @ 2018-07-18 20:52 青蛙快飞阅读(3477) 评论(0) 推荐(0)

windows下primer3-py安装

摘要：primer3是由怀特黑德生物医学研究所Steve Rozen等人发起的一个自动寡核苷酸分析和设计的开源项目，被广泛应用在分子生物领域。primer3-py是用python语言封装的primer3的API，官方推荐安装linux，mac平台，如何在windows平台下安装呢？阅读primer3-p 阅读全文

posted @ 2018-07-18 20:51 青蛙快飞阅读(1639) 评论(0) 推荐(0)

pysam操作sam文件

摘要：pysam模块因为要分析sam文件中序列的情况，因此要对reads进行细分，所以之前想用数据库将sam文件信息存储，然后用sql语句进行分类。后来发现很麻烦，pysam就是一个高效读取存储在SAM / BAM / CRAM格式文件中的映射短读序列数据信息的python模块，可以轻松地对reads进阅读全文

posted @ 2018-07-18 20:47 青蛙快飞阅读(2899) 评论(0) 推荐(0)

NCBI SRA数据库

摘要：简介 SRA数据库是美国国立卫生研究院（NIH）的高通量测序数据的主要归档，是国际核苷酸序列数据库协作（INSDC）的一部分，其中包括NCBI序列读取存档（SRA），欧洲生物信息学研究所（EBI）和DNA数据库日本（DDBJ）。提交给三个组织中的任何一个的数据都是共享的。 SRA数据库数据来自高阅读全文

posted @ 2018-07-18 20:44 青蛙快飞阅读(3142) 评论(0) 推荐(0)

通过bed文件获取fasta序列

摘要：一、BED 文件格式 BED 文件格式提供了一种灵活的方式来定义的数据行，以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致。必须包含的3列： 1.chrom, 染色体名字(e.g. chr3， chrY) 2.chromStart, 目标区段在染色体起始位置阅读全文

posted @ 2018-07-18 20:43 青蛙快飞阅读(1243) 评论(0) 推荐(0)

利用mysql客户端查询UCSC数据库

摘要：UCSC Genome Browser是由University of California Santa Cruz (UCSC) 创立和维护的，该站点包含有人类、小鼠和大鼠等多个物种的基因组草图和注释信息，并提供一系列的网页分析工具。 1.MySQL安装本人使用的是Centos6.8系统，推荐使用y 阅读全文

posted @ 2018-07-18 20:41 青蛙快飞阅读(435) 评论(0) 推荐(0)

加载中......

生信小栈

亚恒的生信学习笔记

07 2018 档案

公告