图机器学习导论

图机器学习原理

机器学习算法分为三大类,即监督学习、无监督学习和半监督学习。这些学习模式取决于向算法提供数据的方式和性能的评估方式。

监督学习(Supervised learning) 是当我们知道问题的答案时所使用的学习范式。在此场景中,数据集由形式为< x , y >的成对样本组成,其中x是输入(例如,图像或语音信号),y 是相应的期望输出(例如,图像表示的内容或语音表示的内容)。输入变量也称为特征(features),而输出通常称为标签(labels)、目标(targets)和注释(annotations)。在监督设置中,通常使用距离函数来评估性能。根据标签的类型,监督学习可以进一步分为以下几类:

  分类(Classification):这里的标签是离散的,指的是输入所属于的“类”。分类的例子包括确定照片中的对象或预测电子邮件是否为垃圾邮件。
  回归:目标是连续的。回归问题的例子是预测建筑物的温度或预测任何特定产品的销售价格。
无监督学习(Unsupervised learning) 不同于监督学习,因为问题的答案是未知的。在这里,我们没有任何标签,只有输入< x > 被提供。因此,我们的目标是推断结构和模式,试图找到相似之处。发现相似样本组(聚类 clustering),高维空间中数据的表示都属于无监督学习。

半监督学习(semi-supervised learning) 算法使用标记和未标记数据的组合进行训练。通常,为了指导对无标记输入数据中存在的结构的研究,会使用数量有限的标记数据。

同样值得一提的是,强化学习(reinforcement learning) 被用来训练机器学习模型来做出一系列的决策。人工智能算法面临类似游戏的情况,根据执行的行动获得惩罚或奖励。算法的作用是理解如何行动,以最大化奖励和最小化惩罚。

图机器学习领域应用

路径搜索和查找:最短路径,例如导航

分析节点重要度:度中心性评价,例如PageRank(评价谷歌搜索中哪些页面比较重要放在前面)

社群检测:银行信用卡欺诈,识别风险村

连接检测:社交网络推荐可能认识的人,商品的推荐系统

节点相似度:两节点相距甚远但相似,便可通过节点相似度将两个无关但相似的人进行匹配

图嵌入:把节点映射成d维向量,反应节点的语义和连接关系

以上应用分为几个层次的任务:

节点层次(Node Level):从已知的节点推未知的节点,如蛋白质的三维空间结构预测:AlphaFold,核心思路:空间图

边层次(Edge Level):推荐系统中的应用:PinSage

社群层次(子图 Subgraph Level):导航:高德地图

图层次(Graph Level):药物设计:抗生素药物分子设计

革命性进展:

  AI绘画

  ChatGPT

  AlphaFold

参考资料

图机器学习、图数据挖掘、图神经网络、知识图谱入门必学公开课:斯坦福大学CS224W。算法讲解、论文精读、代码实战中文精讲。

同济子豪兄中文精讲课程主页:https://github.com/TommyZihao/zihao_course/tree/main/CS224W

视频合集:https://space.bilibili.com/1900783/channel/collectiondetail?sid=915098

斯坦福官方课程主页:https://web.stanford.edu/class/cs224w

 

posted @   xin1996  阅读(52)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示