上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 20 下一页

随机森林简介

摘要: 随机森林是机器学习中的一种分类算法,在介绍随机森林之前,非常有必要了解决策树这种分类器。 决策树是一种分类器,通过训练集构建一颗决策树,从而可以对新的数据预测其分类。一颗构建好的决策树如下: 图片来源于百度百科,可以看到这颗决策树的目标是将数据分成 "使用" 和 "不使用" 两类,分类的条件有树中的 阅读全文
posted @ 2017-08-14 13:38 庐州月光 阅读(1876) 评论(0) 推荐(0)

Linux 查看操作系统版本

摘要: 在下载软件的时候,需要知道操作系统对应的版本,通过 可以查看对应信息 运行的结果如下: 从而确定当前操作系统为centos 6.7 版本 阅读全文
posted @ 2017-08-11 10:55 庐州月光 阅读(322) 评论(0) 推荐(0)

RNA_seq GATK 最佳实践

摘要: GATK处理DNA 水平的snp 经验比较成熟,而RNA 水平较少,所以可能会存在错误 目前的流程兼顾了假阳性(不是真的snp位点)和假阴性(该位点是snp,却没有检测到);后续会不断改善 GATK SNP calling pipeline 分成3个部分: 1)DATA CLEANUP 2) VAR 阅读全文
posted @ 2017-08-10 16:34 庐州月光 阅读(1517) 评论(0) 推荐(0)

Bioperl 解析blast的输出结果

摘要: 用bioperl 解析blast的默认输出结果, 整理成-m8格式的输出 阅读全文
posted @ 2017-08-08 14:01 庐州月光 阅读(1220) 评论(0) 推荐(0)

perl 模块的创建以及制定perl 模块的路径

摘要: 1) perl 模块的创建 perl 模块的后缀名为.pm, 其中的内容和一般的perl脚本相同, perl模块中通常放置可重用的函数以及变量, 比如创建一个fasta.pm,里面包含一个统计fasta序列中gc碱基个数的方法: 然后写一个脚本检测一下该模块是否起作用: 运行该脚本,输出结果为7, 阅读全文
posted @ 2017-08-08 14:00 庐州月光 阅读(3637) 评论(0) 推荐(0)

R语言在柱状图上添加文字

摘要: 代码示例: 效果图如下: 阅读全文
posted @ 2017-08-08 13:49 庐州月光 阅读(5750) 评论(0) 推荐(0)

R语言绘制带errorbar 的柱状图

摘要: 代码示例: 效果图如下: 阅读全文
posted @ 2017-08-04 10:41 庐州月光 阅读(5395) 评论(0) 推荐(0)

mothur summary.seqs 统计fasta文件中每条序列的长度

摘要: 在介绍summary.seqs的用法之前,我们首先需要搞清楚两个概念: 1)ambiguous bases 中文叫做模糊碱基,对于DNA序列来说,只有ATCG 4种碱基,在IUPAC定义的碱基标准中,出了上述4种碱基之外,还包括其他的碱基,可以代表不同类型的碱基 模糊碱基实际上就是除了A T C G 阅读全文
posted @ 2017-08-02 11:28 庐州月光 阅读(1445) 评论(0) 推荐(0)

mothur reverse.seqs 将序列反向互补

摘要: reverse.seqs 命令可以得到输入序列的反向互补序列 用法: input.fasta 的内容如下: 运行成功后,会输出一个 input.rc.fasta 文件,该文件中就是input.fasta 的反向互补序列 input.rc.fasta 的内容如下: 阅读全文
posted @ 2017-08-02 10:55 庐州月光 阅读(405) 评论(0) 推荐(0)

Quorumpeps 群体感应数据库简介

摘要: 群体感应的定义: 细菌能自发产生、释放一些特定的信号分子,并能感知其浓度变化,调节微生物的群体行为, 这一调控系统称为群体感应。细菌群体感应参与包括人类、动植物病原菌致病力在内的多种生物学功能的调节。 近年来的研究证明细菌之间存在信息交流,许多细菌都能合成并释放一种被称为自诱导物质(autoindu 阅读全文
posted @ 2017-08-01 16:52 庐州月光 阅读(1007) 评论(0) 推荐(0)
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 20 下一页