摘要:subprocess 模块中有一个功能Popen , 可以在代码中调用系统的命令 其功能比os.system 更加强大 代码示例: 上述代码中,首先用shlex.split 函数分割命令行参数,然后将参数传递给Popen 函数,执行对应的系统命令,wait() 函数表示等待系统命令执行结束
阅读全文
摘要:shkex 模块最常见的用法就是其中的split 函数,split 函数提供了和shell 处理命令行参数时一致的分隔方式 代码示例: 在shell 中,对于选项和对应的值之间可以有多个空格,而shlex.split 保持了和sell 一致的处理方式 从上述代码的运行结果,可以看出来
阅读全文
摘要:os模块提供了文件系统路径方面的功能 常见用法: 代码示例: 这段代码返回的是python 脚本所在的目录 代码示例: 这句代码返回的是脚本的绝对路径
阅读全文
摘要:tRNAscan-SE 软件可以根据输入的基因组序列,预测对应的tRNA的基因 在线的tRNAscan-SE的链接如下:http://lowelab.ucsc.edu/tRNAscan-SE/ 如下图所示,只需要输入fasta 格式的序列,选择对应的物种类型和其他的一些选项,点击运行按钮即可 结果界
阅读全文
摘要:线粒体基因组是一个环状的双链DNA分子,包括轻链 L 和 重链 H, 其基因结构在哺乳动物中保守, 以human 线粒体为例, 人类线粒体基因组全长 16,596 bp , 共有13个编码蛋白的基因,根据编码的蛋白可以分成3类: 共有22种tRNA的基因 2种 rRNA 基因: 在人类的线粒体基因组
阅读全文
摘要:今天在使用muscle 软件进行多序列比对时,发现输出的结果全部为gap, 而且还没有明显的报错信息 找了很久之后,终于发现了问题 muscle 为了追求速度,对输入序列的个数和长度进行了限制 下面是官方说明文档中的原话: 我的输入序列长度为5k 左右, 最终输出的结果全部为gap 经过测试,我发现
阅读全文
摘要:interproscan 软件实际上将对输入的查询序列和interpro 数据库中的序列去比对,将比对上的序列对应的GO信息作为查询序列的GO注释 在interpro 数据库中,每条蛋白质序列有一个唯一的interpro 编号,类似 IPR034725 这种格式,而每条蛋白又有对应的GO注释信息;
阅读全文
摘要:interpro 通过整合多个蛋白相关的数据库,提供了一个方便的对蛋白序列进行功能注释的平台,功能注释的内容包括蛋白质家族预测,domain 和 结合位点预测 interoro 在整合多个数据库的同时,去掉了冗余,提供了一个统一的接口,用来对序列进行功能注释;而且还提供了interproscan 这
阅读全文
摘要:perl 语言中的引用共分为两类: 声明引用时只需要在对象的前面加上反斜杠 第一列是数组的引用: 代码示例: 第二种是哈希的引用 代码示例: 通过引用去访问对应的值,通过 -> 操作符 数组的引用, 通过 [ ] 中括号 加上对应的下标,代码示例: 哈希的引用,通过{} 大括号加上对应的key,代码
阅读全文
摘要:labs 函数主要有以下三个用途: 1) 设置图片的标题(title), 子标题(subtitle), 引用(caption) 代码示例: 效果图如下: 2) 修改图片的x轴和y轴的标题 代码示例: 效果图如下: 默认情况下,x轴和y轴的标题对应的是数据框中的列名,labs可以对x轴和y轴的标题重新
阅读全文
摘要:ggplot2 是一套独立的绘图系统,在一个完整的ggplot2的图表中,会有下面几个概念: 1) plot 2) panel 3) strip 4) legend 所有这些元素都会出现在图表中 代码示例: 效果图如下: 在代码中,通过theme 函数,我为不同的对象设置了不同的填充色,用以区分 从
阅读全文
摘要:ggplot2是一个绘制可视化图形的R包,汲取了R语言基础绘图系统(graphics) 和l attice包的优点,摒弃了相关的缺点,创造出来的一套独立的绘图系统; ggplot2 有以下几个特点: 1) 图形映射, 自动化的将数据映射到图形上; 2) 图层叠加, 将不同形状的图表视为图层(laye
阅读全文
摘要:当我们想要从genbank 中下载序列的时候,总需要点击右上角的download 按钮,选择对应的格式,然后通过浏览器进行下载,这样反复的点击很费时间了 其实可以通过bioperl 自动化的完成下载; 代码如下: 这个脚本接受两个参数,第一个参数为 序列对应的编号,第二个参数为输出的目录 以 htt
阅读全文
摘要:ImageMagick 是一个处理图片的库,有C, perl, python, java 等多种语言对应的库 在安装perl 对应的Image::Magick 模块之前,首先需要安装 ImgeMagick 已经对应的perl的开发包 代码如下: 当上面两个包安装好之后,就可以通过cpan 安装 Im
阅读全文
摘要:perldoc 命令可以查看某个模块的安装路径 命令: 返回值如下:
阅读全文
摘要:pdf 函数中,有一个参数onefile , 默认值为TRUE, 表示每张图片占用pdf 中的一页 当遇到pdf的前几页为空白时,是因为画图的代码产生了几张空白的图片 如果要消除前面的空白,只需要设置onefile = FALSE 就可以了,此时后面的图片会覆盖前面空白的图片,就实现了消除空白页的效
阅读全文
摘要:igaph 是一个项目,目标是建立一条简单,易用的网络分析工具,有 R, python, C/C++ 等语言的具体实现; 项目主页: http://igraph.org/ 在R语言中,对应的就是 igraph 这个R包 安装: 使用: 对于图 graph 这种数据结构而言,最基本的元素包括节点(no
阅读全文
摘要:在绘热图时,需要将数值映射到不同的颜色上,这时就需要一系列的颜色梯度 colorRampPalette 函数支持自定义的创建一系列的颜色梯度 代码示例: 函数的参数c("blue", "red") 指的是颜色从蓝色渐变到红色,5 代表创建长度为5的颜色梯度 有了颜色梯度之后,我们就可以方便的把数值映
阅读全文
摘要:背景: miRNA通过和mRNA的3'UTR区结合,导致mRNA讲解或者抑制mRNA翻译,从而实现转录后调控的作用; 如果在miRNA和 mRNA的结合区域,发生了snp,就可能会影响miRNA和mRNA的结合;导致疾病或者其他的一些变化; 所以位于结合区域的snp 位点有极大的研究价值; 简介:
阅读全文
摘要:在R语言中,对于图中的点来说,有很多种坐标系来进行定位 举个例子: par(omi = c(1, 1, 1, 1), mai = c(1, 1, 1, 1), mfrow = c(1, 2))plot(1:5)box(which = "plot", col = "red", lwd = 2)box(
阅读全文
摘要:在R语言的基础绘图系统中,有plot, figure, outer, inner 共4种边框; 这四种边框实际上明确了整个绘图设备的布局 1) outer, 当我们声明一个绘图设备的时候,outer 指的就是这个设备上,下,左,右4个边框 代码示例: 生成的图片如下: 可以看到 outer 边框为整
阅读全文