神经网络学习之----玻尔兹曼机

退火

  退火是一种金属的热处理工艺,将金属加热到一定的温度,保持足够时间,然后以适宜速度缓慢冷却。

  退火可以改善材料性能,提升金属品质。

 模拟退火算法

  根据梯度下降算法考虑,梯度下降算法会使得我们的代价函数的值只会往梯度下降的方向走,比如左图(a),当它走到第一个凹坑里的时候它就在也出不来了。而不会到达全局的最小值,会陷入局部最小值出不来。

  模拟退火算法,也叫随机网络算法,如右图(b)。它和梯度下降法的能力就不一样,它具有“爬坡”或“跳跃”的能力,它会在局部最小值里面跳出来,使损失函数的值不断下降,最终达到全局最小值。

那么这是为什么呢?

  模拟退火算法会根据接受概率来判断要怎么走。假设前一状态为x(n),系统受到一定的扰动,状态变为x(n+1),相应地,系统能量由E(n)变为E(n+1)。定义系统由x(n)变为x(n+1)的接受概率为p:

  意思就是,当损失函数从能量高的地方走向能量低的地方时,其概率为1,表示以一定转移。当损失函数从能量低的地方走向能量高的地方时,比如从局部最小值跳出来,那么就就有一定概率来判断它是否跳出,这个概率就是一个能量和温度(T)之间关系的算式。

  当T越大,接收概率P就越大,小球跳跃的能力就越高,就更容易跳出这个局部最小值。

  当T越小,接收概率P就越小,小球跳跃的能力就越低,就不容易跳出这个局部最小值。

  E(n+1)-  E(n)越大,接收概率P就越小。

  E(n+1)-  E(n)越小,接收概率P就越大。

  所以,在一开始,温度的初始值T要选得足够高,使得所有可能的状态转移都能被接受。然后温度逐渐下降。

退火速率

  指数下降方式:T(n) = λT(0) n=1,2…,λ是一个小于1的正数,可以取0.8-0.99之间。

  其他下降方式:  

  

模拟退火算法过程

  1.初始化。随机选择一定的值作为变量的数值x(0),并设置初始温度T(0),终止温度T final 和温度的下降公式。

  2.以一定的规则(沿着梯度下降的方向走一段距离,或者在x点附近随机取一个点)在当前状态x(n)附近产生新的状态x(n+1)。如果能量减小则改变状态,如果能量变大则以一定的概率判断是否要改变状态。

  3.在一定的温度T下迭代一定的次数,或者判断代价函数是否趋于稳定。然后终止内循环(内循环中T不变,让状态自由改变)。

  4.调整T,判断T是否是小于等于T final 。没有小于等于T final 的话,则跳转到第二步继续执行。如果小于等于T final 的话,则终止算法。

随机神经网络(玻尔兹曼机BM)

  玻尔兹曼机分为两种:(a)自联想型BM网络,(b)异联想型BM网络

  一共分为两层,分为可见节点和隐节点。首先看(a)自联想型BM网络,它的可见节点既是输入节点又是输出节点。当我们输入测试数据时,从可见节点输入,也从可见节点输出结果。再看(b)异联想型BM网络,它的可见节点既是输入节点又是输出节点。当我们输入测试数据时,从一部分可见节点输入,从另一部分可见节点输出结果。

玻尔兹曼机的训练

正向学习阶段:
  ➢ 自联想型BM网络:向网络输入信号,钳制输入输出节点,让隐节点自由活动
  ➢ 异联想型BM网络:向网络输入信号,钳制输入输出节点,让隐节点自由活动
反向学习阶段:
  ➢ 自联想型BM网络:向网络输入信号,让输入输出节点和隐节点都自由活动
  ➢ 异联想型BM网络:向网络输入信号,钳制输入节点,让输出节点和隐节点自由活动

 

Boltzmann Machine

 

posted @ 2018-06-07 16:13  会飞的鱼摆摆  阅读(1018)  评论(0编辑  收藏  举报