摘要:
通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 以后有时间再对单个算法做深入地解析。 今天的算法如下: 决策树 随机森林算法 逻辑 阅读全文
摘要:
装载 作者:kicilove 来源:CSDN 原文:https://blog.csdn.net/kicilove/article/details/76060980?utm_source=copy data.table包使用总结R中的data.table包提供了一个data.frame的高级版本,让你 阅读全文
摘要:
STAR 本文出自于http://www.bioinfo-scrounger.com 第一次听说START这款比对软件是因为其是ENCODE计划的御用软件,ENCODE计划(ENCyclopedia Of DNA Elements)又称人类基因组DNA元件百科全书计划,是2003年在人类基因组计划完 阅读全文
摘要:
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。 本文目录: 1. 欧氏距离 2. 阅读全文
摘要:
1、用0替代数据框中的缺失值NA 生成数据框: > m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10) > d <- as.data.frame(m) V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 1 4 3 NA 3 阅读全文
摘要:
SYNOPSIS samtools view -bt ref_list.txt -o aln.bam aln.sam.gz samtools sort -T /tmp/aln.sorted -o aln.sorted.bam aln.bam samtools index aln.sorted.bam 阅读全文
摘要:
Axt format BAM format BED format BED detail format bedGraph format barChart and bigBarChart format bigBed format bigGenePred table format bigPsl table 阅读全文
摘要:
Introduction Pysam is a python module that makes it easy to read and manipulate mapped short read sequence data stored in SAM/BAM files. It is a light 阅读全文
摘要:
pysam - 多种格式基因组数据(sam/bam/vcf/bcf/cram/…)读写与处理模块(python) 在开发基因组相关流程或工具时,经常需要读取、处理和创建bam、vcf、bcf 文件。目前已经有一些主流的处理此类格式文件的工具,如samtools、picard、vcftools、bcf 阅读全文
摘要:
众多周知,R语言提供了各种各样的包,方便实现我们的目的,下面给大家介绍一个可以便捷的画曼哈顿图的包:qqman install.packages(“qqman”) # 安装包 library(“qqman”) #加载包 data(package=“qqman”) # 查看qqman包中的测试数据,此 阅读全文