机器学习 —— 概率图模型(学习:综述)

  今天Google的机器人AlphaGo获得了围棋对阵李世石的第二场胜利,我也进入到概率图模型学习模块的阶段。Machine Learning 令人着迷也令人畏惧。

——题记

1、基于PGM的学习

  ANN网络的拓扑结构往往是类似的。同一套模型以不同的样本进行训练,可以获得不同的结果。PGM可以人为的向网络中添加先验知识,在设计以及分析时有更好的可读性。此外,概率图模型在序列变量的学习上,要优于常规机器学习算法。本质上,基于PGM的学习是在给定Dataset的基础上,对随机变量的分布进行估计。

  

2、学习可分为以下几种情况:

  1、数据完整,网络结构完整

  2、数据不完整,网络结构完整

  3、数据不完整、网络结构不完整

  4、数据完整,网络结构不完整

  5、存在隐藏变量,且数据不完整

3、学习可分为以下几种目的:

  1、针对新的实例回答概率询问:拿出三个香蕉一个苹果,箱子里水果比例是多少

    特点:容易计算

  2、针对新的实例进行预测:获得某个像素求label

    特点:关心特定的目标。优化模型选择简单。

    

  3、对给定数据挖掘其联系:奶粉与尿布的相关性

4、避免过拟合

  使用超参数,将数据集分成:训练集,校正集,测试集,利用校正集来对超参数进行校正。

 

posted @ 2016-03-10 21:02  IronStark  阅读(1505)  评论(0编辑  收藏  举报