【怪毛匠子整理】

 

一、使用SOFT文件

1. 确定GEO平台,比如GPL25318, 通过NCBI找到这个平台,也可以通过下面的链接,把GPL25318 替换成你想要的平台ID。

1
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL25318

2. 下载SOFT文件 

 

 

 

点开红框:

下载文件:

 

 

 

 解压文件:

 

 

 

R语言处理# 读入文件

1
df2=read.table("GPL25318_family.soft",sep = "\t")<br># 使用merge合并<br>

  

 

【怪毛匠子整理】

二、使用GEOquery包

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
library(GEOquery)
GPL=getGEO("GPL25318",destdir = ".")
g1=Table(GPL)
 
head(exprSet$ID)
 
[1] "200000_s_at" "200001_at"   "200002_at"   "200003_s_at" "200004_at"   "200005_at"
 
new_datasets=merge(exprSet,g1,by  = "ID" ,all.x = T)
 
colnames(new_datasets)
[1] "ID"                        "GSM******"                "GSM******"
.....
[247] "GSM******"                "GSM******"                "GSM******"
[250] "Ensembl Version"           "Ensembl Genome Version"    "Orientation"
[253] "Probeset mapping position" "Ensembl Gene ID"           "Gene Symbol"
[256] "Chromosomal location"      "Strand"                    "Gene Description"
[259] "Entrez Gene"               "SPOT_ID"

  这样就搞定了!

【怪毛匠子整理】