摘要: 1,使用内建函数open打开文件: 方法一: f = open('path', 'r'/'w') for line in f: ..... f.close() 方法二: with open('path','r'/'w') as f: ..... 2. 对于可读文件,常用的方法是read、 seek、 阅读全文
posted @ 2019-07-31 17:35 luxliy 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 层次聚类分为:凝聚法和分裂法。 凝聚法: 假设有N个待聚类的样本,对于层次聚类来说,基本步骤就是: 1、(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度(杰卡德距离); 2、寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个); 3、重新计算新生成的 阅读全文
posted @ 2019-03-25 15:44 luxliy 阅读(1020) 评论(0) 推荐(0) 编辑
摘要: ICA 属于一种盲源分离。 盲信号分离研究的信号模型主要有线性混合模型和卷积混合模型,盲源分离源信号线性混合是比较简单的一种混合形式,典型的BSS/ICA问题就是源于对独立源信号的线性混合过程的研究。 盲源分离 可以用来降噪。 阅读全文
posted @ 2019-03-25 15:14 luxliy 阅读(2152) 评论(0) 推荐(0) 编辑
摘要: 伯努利实验: 如果无穷随机变量序列 是独立同分布(i.i.d.)的,而且每个随机变量 都服从参数为p的伯努利分布,那么随机变量 就形成参数为p的一系列伯努利试验。同样,如果n个随机变量 独立同分布,并且都服从参数为p的伯努利分布,则随机变量 形成参数为p的n重伯努利试验。 伯努利试验是只有两种可能结 阅读全文
posted @ 2019-03-21 13:31 luxliy 阅读(7525) 评论(0) 推荐(0) 编辑
摘要: 1,F1=2*(准确率*召回率)/(准确率+召回率) F1的值是精准率与召回率的调和平均数。F1的取值范围从0到1的数量越大,表明实现越理想。 Precision(精准率)=TP/(TP+FP) Recall(召回率)= TP/(TP+FN) 2,均方误差(MSE,Mean Square error 阅读全文
posted @ 2019-03-15 10:44 luxliy 阅读(3914) 评论(0) 推荐(0) 编辑
摘要: 文章题目:Patchwork: allele-specific copy number analysis of whole-genome sequenced tumor tissue 特点: 可以检测配对样本,也可以检测带reference的tumor样本。但是没有考虑肿瘤异质性问题。使用DNAco 阅读全文
posted @ 2019-03-15 09:44 luxliy 阅读(1292) 评论(0) 推荐(0) 编辑
摘要: 如何划窗统计测序数据的reads数(depth):https://blog.csdn.net/shenshenwu666/article/details/80936374 方法1,用samtools depth。但是这个方法仅仅局限于对单个位点进行depth进行统计 samtools depth - 阅读全文
posted @ 2018-10-30 11:21 luxliy 阅读(2718) 评论(0) 推荐(1) 编辑
摘要: NCBI上有一个综合各类人类数据库的网页:Human Genome Resources at NCBI: https://www.ncbi.nlm.nih.gov/genome/guide/human/ 各大浏览器资源: 一、临床或者变异数据资源 ClinVar & Variation Resour 阅读全文
posted @ 2018-10-19 17:54 luxliy 阅读(4922) 评论(0) 推荐(0) 编辑
摘要: 1,Fastq数据质控 2,Fastq转化成bam,包含头文件 3,sam 转化成bam,如果SAM文件中有header @SQ lines。 4,sort bam 5, 标记重复 6, index 一下 7,Base Quality Score Recalibration 8, 使用GATK检测S 阅读全文
posted @ 2018-10-17 17:48 luxliy 阅读(1671) 评论(0) 推荐(0) 编辑
摘要: GATK的pipeline使用WDL进行编写 WDL是一种流程管理语言,内置的支持并行,适合编写pipeline 运行wdl脚本需要两步:第一步编辑参数列表对应的json文件,第二步直接运行Cromwell.jar eg 对于一个WDL脚本,有5个核心结构: 1,workflow 2, task:代 阅读全文
posted @ 2018-10-16 17:24 luxliy 阅读(2384) 评论(0) 推荐(0) 编辑