随笔分类 - Bioinformatics
生信相关资源
摘要:费城染色体 费城染色体(Philadelphia chromosome, Ph (or Ph') chromosome),或称费城染色体易位(Philadelphia translocation),是一种与慢性粒细胞性白血病(chronic myelogenous leukemia, CML)相关的
阅读全文
摘要:微信公众号:生物信息学起步如果觉得对你有帮助,欢迎关注/转发/分享[1] 内容目录 1、目的2、实验数据2.1 候选增强子识别2.2 转基因小鼠分析2.3 注释3、搜索数据库3.1 概括3.2 高级搜索3.3 搜索结果3.4 数据集页面4. Gallery5. 教程6. 试剂和胚胎可用性原文链接 1
阅读全文
摘要:原文链接 https://www.jianshu.com/p/386f520e5de1 The SAM Format Specification(sam格式说明) 1 The SAM Format Specification sam是一种序列比对后的输出格式,以tab作为分隔符,包括头部信息和比对信
阅读全文
摘要:打开Cytoscape软件,根据菜单导入string_interactions.tsv文件 File > Import > Network from File 会弹出下图对话框,在对话框中设置如下: 选中string_interactions.tsv文件,点击打开,导入文件,结果如下图所示。 点击O
阅读全文
摘要:MicroRNA (miRNA) 是一类内生的、长度约为20-24个核苷酸的小 RNA,其在细胞内具有多种重要的调节作用。每个 miRNA 可以有多个靶基因的表达,而几个 miRNA 也可以调节同一个基因的表达。据推测,miRNA 调节着人类三分之一的基因。 miRNA命名 1、物种 hsa、mmu
阅读全文
摘要:前言 本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquitin-proteasome system by the FoxO transcriptional ne
阅读全文
摘要:Gene Expression Omnibus(GEO)是一个公共存储库,可以存档和自由分发由科学界提交的全套微阵列,新一代测序和其他形式的高通量功能基因组数据。 除数据存储外,还提供一系列基于Web的界面和应用程序,以帮助用户查询和下载存储在GEO中的研究和基因表达模式。 GEO的数据储存方式 G
阅读全文
摘要:Gnuplot是一个用C编写的用于生成二维和三维图命令行程序,对于脚本驱动的图形,gnuplot是迄今为止最受欢迎的程序。在Centos安装gnuplot,如下所示: 在运行一些生物信息软件的时候,提示:Could not find/open font when opening font “aria
阅读全文
摘要:NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源。NCBI资源包括Entrez、Entrez编程组件、MyNCBI、PubMed、PudMed Centra
阅读全文
摘要:isPCR是用一对PCR引物搜索序列数据库。它使用索引策略来快速完成此操作。当搜索成功时,输出是fasta格式序列文件,其包含数据库中位于引物对之间的所有区域。 Linux系统下安装 1. 使用二进制文件 isPCR提供linux二进制执行文件,执行时报错缺少"lib.so.6"库文件。 安装ope
阅读全文
摘要:生物数据库 生物数据库是收集自科学实验、出版文献、高通量实验技术和计算分析等生命科学信息库,它包含来自基因组学、蛋白质组学、代谢组学、微阵列基因表达和系统发育学等领域的信息。 生物数据库大致可分为序列、结构和功能数据库。序列数据库储存核酸和蛋白质序列;结构数据库储存RNA和蛋白质的结构信息;功能数据
阅读全文
摘要:如何计算每个基因的覆盖度与深度,有多种方法可以完成。如下演示使用samtools depth命令方法 1. 数据下载 1.1 Fastq文件下载 从NCBI下载Illumina Hiseq X Ten平台的RNA-Seq数据SRR7751429信息如上图所示。 1.1.1 使用wget命令(sra-
阅读全文
摘要:简介 NCBI除了提供在线的Web BLAST序列比对服务外,还提供FTP方式下载序列比对工具。这允许在本地平台上针对从NCBI下载或本地创建的数据库执行BLAST搜索。这些实用程序没有图形用户界面,通过类似DOS的命令窗口运行,并通过基于文本的命令行开关接受输入。 以下内容介绍了在运行Window
阅读全文
摘要:在生物信息学分析中,经常对DNA序列进行一系列操作,包括子序列截取,互补序列获取,反向序列获取,反向互补序列获取。在python语言中,可编写如下函数完成这些简单功能。 子序列截取 python中对序列截取使用字符串切片功能就可以完成,例如: 注意,切片操作是“0-base”的,包左不包右。 互补序
阅读全文
摘要:Ensemble公共MySQL数据库 对于大量数据和更详细的分析,Ensemble的MySQL服务器ensembldb.ensembl.org,useastdb.ensembl.org或asiadb.ensembl.org,可以以匿名方式访问。 第三台服务器martdb.ensembl.org提供对
阅读全文
摘要:UCSC Genome Browser是由University of California Santa Cruz (UCSC) 创立和维护的,该站点包含有人类、小鼠和大鼠等多个物种的基因组草图和注释信息,并提供一系列的网页分析工具。 1.MySQL安装 本人使用的是Centos6.8系统,推荐使用y
阅读全文
摘要:Biopython项目是旨在减少计算生物学中代码重复的开源项目之一,由国际开发人员协会创建。 它包含表示生物序列和序列注释的类,并且能够读取和写入各种文件格式(FASTA,FASTQ,GenBank和Clustal等), 支持以程序化方式访问生物信息的在线数据库(例如,NCBI)。 独立的模块扩展了
阅读全文
摘要:FASTX-Toolkit组件用法 Command Line Arguments FASTQ-to-FASTA FASTQ/A Quality Statistics FASTQ Quality chart FASTQ/A Nucleotide Distribution chart FASTQ/A C
阅读全文
摘要:FASQT格式是用于存储生物序列(通常是核苷酸序列)及其相应的碱基质量分数的一种文本格式。为简洁起见,序列字母和质量分数均使用单个ASCII字符进行编码。最初由Wellcome Trust Sanger Institute(桑格研究所)开发用于捆绑FASTA格式的序列和其碱基质量分数的,现在已成为存
阅读全文