OGB相关资料
使用PyTorch Geometric(PyG) 构建GNN模型,应用在OGB的两个benchmark数据集上,分别执行节点属性预测和图的预测任务。
1.加载数据集
首先会去下载数据,要等挺久的
from ogb.nodeproppred import NodePropPredDataset
dataset = NodePropPredDataset(name = 'ogbn-mag')
split_idx = dataset.get_idx_split()
train_idx, valid_idx, test_idx = split_idx["train"], split_idx["valid"], split_idx["test"]
graph = dataset[0] # pyg graph object
可以执行用索引提取Data,切片,应用DataLoader等操作。
DataLoader的shuffle:训练时置True,测试时置False
split_idx是类似这样的字典:
{‘train’: tensor([ 0, 1, 2, …, 169145, 169148, 169251]),
‘valid’: tensor([ 349, 357, 366, …, 169185, 169261, 169296]),
‘test’: tensor([ 346, 398, 451, …, 169340, 169341, 169342])}
报错
1.ImportError: cannot import name 'PygNodePropPredDataset' from 'ogb.nodeproppred'
解决办法:把PygNodePropPredDataset
改成NodePropPredDataset
即可
不知道为什么不能调用DGL和pyG了
参考资料:
OGB数据集的加载与处理【基于PyG】
官网
baseline
cs224w(图机器学习)2021冬季课程学习笔记8 Colab 2
【CS224W 06】DeepLearning for Graph 作业
我向OGB排行榜提交代码的经历
斯坦福大学开源用于网络神经百万量级OGB基准测试的数据集
OGB数据集《Open Graph Benchmark: Datasets for Machine Learning on Graphs》
图基准数据集(OGB)
[论文精读]Correct and Smooth: 用一个MLP超越GNN