R语言选取两个不同年份随访的共同ID个案
上面分别为基线2011年和2018年的随访数据,我们的目的是分析在基线2011年和2018年均有随访数据的ID,下面用R语言完成
library(foreign) library(tidyverse) data2011<-read.spss("C:/Users/Yan/Desktop/2011基本信息+体检问卷+健康状况和功能+血检数据+ID在十位上加0.sav",to.data.frame = T,use.value.labels = F) data2018<-read.spss("C:/Users/Yan/Desktop/2018基本信息+健康状况和功能+认知和抑郁.sav",to.data.frame = T,use.value.labels = F) # use.value.labels = F 是为了将变量的标签不导入到数据中 interID<-intersect(data2011$ID,data2018$ID) class(data2011) newdata2011<-data2011 %>% as_tibble() %>% filter(.,ID %in% interID) newdata2018<-data2018 %>% as_tibble() %>% filter(.,ID %in% interID) write.csv(newdata2011,"newdata2011.csv",row.names = F,na =".") write.csv(newdata2018,"newdata2018.csv",row.names = F,na =".") # na ="." 是为了将缺失值设置为"."