链路预测
链路预测:估计两个节点之间产生连接的可能性
https://zjt-blog.readthedocs.io/zh/latest/embeddings/link_prediction.html
里面主要讲了链路预测问题中的传统机制模型。
- 数据集划分
- 相似性指标
- 算法评价指标
链路预测问题的机器学习模型:将链路预测视作一个二分类问题,将网络中存在的边都视为正样本(即正边),不存在的连边都视为负样本(即负边)。然后,将这些边分为两部分,一部分为训练集,一部分为测试集。训练集和测试集中都包含正边和负边,目的是训练一个分类器,用于分类两种边。
具体实现时:因为网络是稀疏的,需要去平衡正负样本。
实现
利用DeepSNAP把networkx中的网络转成PyTorch Geometric需要的格式