plink格式中如何提取map文件重复的位点

1、

复制代码
dat <- read.table("test.map",header = F)
dat2 <- dat[c(1,4)]
unique(sort(dat2$V1))
dat2[dat2$V1 == "X",]$V1 = 10000
dat2$V1 <- as.numeric(dat2$V1)
dat2$V4 <- as.numeric(dat2$V4)
dat3 <- dat2[order(dat2$V1,dat2$V4),]
dat4 <- dat[duplicated(dat3),]
dim(dat4)
write.table(dat4$V2, "dup1.txt",col.names = F, row.names = F,quote = F,sep = "\t")
复制代码

 

 

2、简化程序

dat <- read.table("test.map",header = F)
dat2 <- dat[c(1,4)]
dat3 <- dat[duplicated(dat2),]
write.table(dat3$V2, "dup2.txt",col.names = F, row.names = F,quote = F,sep = "\t")

 

posted @   小鲨鱼2018  阅读(206)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示