机器学习 —— 概率图模型(学习:综述)
今天Google的机器人AlphaGo获得了围棋对阵李世石的第二场胜利,我也进入到概率图模型学习模块的阶段。Machine Learning 令人着迷也令人畏惧。
——题记
1、基于PGM的学习
ANN网络的拓扑结构往往是类似的。同一套模型以不同的样本进行训练,可以获得不同的结果。PGM可以人为的向网络中添加先验知识,在设计以及分析时有更好的可读性。此外,概率图模型在序列变量的学习上,要优于常规机器学习算法。本质上,基于PGM的学习是在给定Dataset的基础上,对随机变量的分布进行估计。
2、学习可分为以下几种情况:
1、数据完整,网络结构完整
2、数据不完整,网络结构完整
3、数据不完整、网络结构不完整
4、数据完整,网络结构不完整
5、存在隐藏变量,且数据不完整
3、学习可分为以下几种目的:
1、针对新的实例回答概率询问:拿出三个香蕉一个苹果,箱子里水果比例是多少
特点:容易计算
2、针对新的实例进行预测:获得某个像素求label
特点:关心特定的目标。优化模型选择简单。
3、对给定数据挖掘其联系:奶粉与尿布的相关性
4、避免过拟合
使用超参数,将数据集分成:训练集,校正集,测试集,利用校正集来对超参数进行校正。