dpcnv reademe

###simulated data
#parameter setting: dc=0.5,p=0.005



###real data
##preprocess
python /home/ty/桌面/真实数据/EGAR00001004836_2561_1/fengge.py     #split the whole genome into 22 samples

#查看该染色体对应参考基因组
samtools view -H test.bam

##calculate ODS    两两比较,overlapratio >= 前者的50%,算重叠。 采用一对一的方式(即在程序中加入 break),所以A和B比较 与 B和A比较的结果是不一样的
python /home/ty/桌面/真实数据/EGAD00001000144_LC/sta_overlap_entry.py    #get the entry of every methods
    #then deliever the results to EXCEL,calculate the ODS in EXCEL though the formula.

##统计交集
python /home/ty/桌面/真实数据/EGAD00001000144_LC/sta_interset.py        #get the 'interset' file,which includes interset of results of four methods

##explain the gene and cytoband
Rscript /home/ty/桌面/真实数据/extract_cytoband_gene/cytobands-genes.R    #得到检测结果对应到cghMCR.gene和chromosomeband.txt文件中,有哪些基因时有用的,然后去知网一个一个搜这些基因的文献是否与样本对应的癌症有关。

##统计cytoband和gene的个数
python /home/ty/桌面/真实数据/extract_cytoband_gene/count.py

posted @ 2021-04-13 15:20  tianyee  阅读(61)  评论(0编辑  收藏  举报