R:SNP数据筛选.R

# 清空工作环境,删除所有对象
rm(list = ls())
library(data.table)

# 加载data.table包
library(data.table)

# 设置工作目录
setwd("C:\\Users\\Administrator\\Desktop") # 设置为你的工作目录路径

# 读取大文件
file_path <- "AMP_lines456_maf0.05_het2N_geno0.6.hmp.txt"  # 替换为你的文件路径
data <- fread(file_path, header = TRUE, sep = "\t") # 使用fread高效读取大文件

# 筛选并在指定范围上下50KB
start_range <- 136606701 - 50000 # 计算范围下限
end_range <- 136613008 + 50000 # 计算范围上限

# 根据条件筛选chr6数据
filtered_data <- data[chrom == "6" & pos >= start_range & pos <= end_range]

# 将筛选结果写入新的文件,确保NA值被正确写出,不添加引号
output_path <- "filtered_data.txt" # 输出文件路径
fwrite(filtered_data, output_path, sep = "\t", na = "NA", quote = FALSE) # 写入文件

# 显示筛选后的结果
print(filtered_data) # 打印筛选后的数据

 

posted @ 2024-06-19 16:07  王哲MGG_AI  阅读(6)  评论(0编辑  收藏  举报