Standard Deviation (SD), Standard Error (SE),Confidence Interval (CI). 画barplot,置信区间
Standard Deviation(SD) 标准(偏)差,代表变量的分散程度,离散量。统计为方差的平方根(Calculated as the root square of the variance) sd<-sd(vec) 等同于 sd<-sqrt(var(vec)) Standard Error

shell 判断条件,退出程序
$cat exit.sh testvcf=$1 if [ ! -f $testvcf ];then echo "testvcf nonexist :$testvcf" exit 0 fi echo "run successful" $ cat run_Exit.sh sh exit.sh 3err

Reference allele mismatch at chr1:1630781 .. REF_SEQ:'C' vs VCF:'T' Ref alleles mismatch between: [VC Unknown @ chr1:1630781 Q. of type=SNP alleles=[T*, C] attr={} GT=[[HG00472 T*/C]] ..
原因是待处理的vcf,他们的ref allele不一致,所以 解决方法是 bcftools norm 先统一 ref allele 如bcftools norm -c s -f /ldfssz1/ST_BIGDATA/USER/st_bigdata/Sentieon/reference_bigdat

概率 贝叶斯公式 先验概率 后验概率
先验概率,后验概率,似然概率,条件概率,贝叶斯,最大似然总是搞混,这里总结一下常规的叫法: 先验概率: 事件发生前的预判概率。可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。一般都是单独事件概率,如P(x),P(y)。 后验概率: 事件发生后求的反向条件概率;或者说,基于先验

AUC ROC ROC: receivers operating characteristic curve,是一种坐标图式的分析工具,是一个二元分类模型(0/1),输出结果只有两种类别的模型。如阳性/阴性,有病/没病,垃圾邮件/非垃圾邮件。 预测错误:针对正样本而言,即预测是正样本,但预测错了FP

先phasing,再impute https://www.jianshu.com/p/c99702068b4a

qplot(quick plot) 快速作图,能读懂就行,推荐用ggplot2适用于各种复杂图 分面 ~.
qplot( x, y, ..., data, facets = NULL, margins = FALSE, geom = "auto", xlim = c(NA, NA), ylim = c(NA, NA), log = "", main = NULL, xlab = NULL, ylab =

ggplot2 分面 fact_grid() facet_wrap()
> facet_grid() 可以应用多个标准对数据分组。 如qplot(carat,price,data=diamonds,alpha=I(0.2))+facet_grid(color~cut) 这里 color~cut 波浪号~ 前是分行依据 波浪号~ 后是分列依据 相比facet_wrap,f

