PhastCons | 序列保守性打分
这是一个进化学上的概念,基因组的序列是不断进化而来的,根据45个脊椎动物的基因组序列,通过多重比对,我们就可以知道人类基因组上每个位置的保守性,一些高度保守的区域可以做非常有意思的下游分析。
This directory contains compressed phastCons scores for multiple alignments of 45 vertebrate genomes to the human genome, plus an alternate set of scores for the primates subset of species in the alignments, and an alternate set of scores for the placental mammal subset of species in the alignments.
下载路径:http://hgdownload.cse.ucsc.edu/goldenpath/hg19/phastCons46way/primates/
chr1.phastCons46way.primates.wigFix的文件内容:
这个文件非常不好处理,需要转化为bed格式,参考链接:Sequence conservation in vertebrates
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | fixedStep chrom=chr1 start=10918 step=1 0.254 0.253 0.251 0.249 0.247 0.244 0.242 0.239 0.236 0.233 0.230 0.226 0.223 0.219 0.215 0.210 |
批量下载文件:
1 2 3 4 5 | for i in ` seq 1 22` do echo $i wget http: //hgdownload .cse.ucsc.edu /goldenpath/hg19/phastCons46way/primates/chr ${i}.phastCons46way.primates.wigFix.gz done |
配套文件
1 | wget http: //hgdownload .soe.ucsc.edu /goldenPath/hg19/bigZips/hg19 .chrom.sizes |
格式转化
1 2 3 4 5 6 7 8 9 10 11 12 13 | #convert to bigWig for file in ` ls *.gz`; do base=` basename $ file .wigFix.gz`; echo $ file ; . /wigToBigWig $ file hg19.chrom.sizes ${base}.bw; done #convert to bedGraph for file in ` ls *.bw`; do base=` basename $ file .bw`; echo $ file ; . /bigWigToBedGraph $ file $base.bedGraph; done # rm *.bw *.wigFix.gz |
然后就用bedtools来操作
求指定区域的score
附录:
工具下载地址:
http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/
待续
标签:
遗传
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)