datawhale-动手学图深度学习task01
动手学图深度学习task1
第一章:介绍
充满图的世界
图包括人类社会、化学相互作用、知识图谱等,可以分为自然定义的和人造的两种,图有时也称为网络,例如社交网络、经济网络等(这些情况下的网络指的不是深度神经网络)。
图的现实世界应用
-
社交网络:
有个著名结论是6度分离(两个人之间可以通过6个人相互连接起来),通过聚类技术(将相似数据点分组)可以实现社交圈、朋友圈。 -
影响力传播:
- 网络分析可以识别基础设施网络的弱点,通过网络分析工具与故障传播模型获得事件的影响。
- 故障传播模型也适用于错误信息传播与病毒传播。
-
知识图谱:
- 知识图谱又称语义网络,表现现实世界实体(即对对象、事件、状况或概念)的网络,并说明它们之间的关系。通常这些信息存储在图形数据库,并以图形结构呈现,称为知识图。
- 知识图谱主要由节点、边、标签三部分组成,任何对象、场所或人员都可以是节点,边定义了节点之间的关系,标签用于描述实体的类别或类型。
-
推荐系统:
商品推荐将用户看作一个子图,将商品看作一个子图,然后寻找两个子图间可能的商品与用户关系,从而实现预测用户偏好,电影推荐同理。 -
生物化学的应用:
蛋白质原子结构的网络、药物相互作用、食物链具有潜在异质节点的网络等,可以进行建模,使用图卷积网络预测影响间的关系。
图结构数据上的机器学习
-
节点预测:预测节点类别或某些属性的取值。
-
边预测:预测两个节点间是否存在链接。
-
图的预测:对不同的图进行分类或预测图属性。
-
节点聚类:检测节点是否形成一个社区。
-
图生成、图演变等。
神经网络应用与图面临的挑战
-
常见的sequence与timer series是规则的结构化的数据,而图数据是非规则的非结构化的数据。
-
图的非结构化表现:
- 任意大小与复杂拓扑结构(一种空间属性的抽象,描述了空间在连续变形下的性质);
- 没有固定的节点排序或参考点;
- 通常是动态且具有多模态(多种数据形态)特征;
- 图的信息不仅在于节点与边还有图的拓扑结构。
-
应用于图的神经网络要求:
- 适用于不同度(与节点直接连接的边的数量)的节点;
- 节点表征(是指将图中的每个节点映射到一个低维的向量空间中,同时尽可能保持图中的结构信息与节点间的关系)计算与邻接节点无关;
- 能根据节点信息、邻接节点信息、边信息、图的拓扑结构计算节点表征。