Hopfield网络和玻尔兹曼机对比，总结，以及受限玻尔兹曼机RBM的提出

7、Hopfield网络

特点：

（1）是一个简单的单层全连接神经网络；

（2）每个神经元和其他神经元是全连接的关系；

（3）在更新网络权重时，有异步工作方式：每次只更新一个神经元的权重，其他权重保持不变；和同步工作方式：所有神经元同时调整状态；

（4）Loss function是什么？（能量函数），能量函数的定义来自于李亚诺夫函数，用来刻画整个网络的能量状态，而且是个单调函数，这也是为什么Hopfield网络容易陷入到局部极小值的原因。

缺点：

（1）容易陷入局部最小值，得不到全局最优解；

8、随机网络（玻尔兹曼机）

特点：

（1）不是按照某种确定性的网络进行状态演化，而是按照某种概率分布决定其状态转移。因此有可能跳出局部极小值；

（2）什么是玻尔兹曼分布（吉布斯分布）？就是系统的状态概率分布。用来刻画系统在不同能量状态下的概率分布，在玻尔兹曼机中引入该分布的目的是：为了让网络能够逃离局部极小值；

（3）玻尔兹曼机中的神经元只有两种输出状态（0和1）；

（4）玻尔兹曼机的网络结构，介于Hopfield网络（神经元全连接）和BP神经网路（3层）之间；

（5） BM网络采用了与DHNN网络相同的能量函数描述网络的状态：

Hopfield网络和玻尔兹曼机对比，总结：

（1）Hopfield网络和玻尔兹曼机，有着不同的网络结构，前者是全连接网络，后者包含了三层（输入层、隐含层和输出层和BP神经网络有相似之处）

（2）Hopfield网络和玻尔兹曼机，有着相同的能量函数：任何两个神经元的状态之积乘上权重，之和。再加上神经元状态和bias之积；

（3）Hopfield网络和玻尔兹曼机，的训练方法不同，前者是按照衡量函数的梯度走的，而能量函数是个单调函数，所以容易陷入到局部极小值，后者是按照概率走的，通过引入玻尔兹曼分布，使得神经元的权重在更新时有了概率，从而具备了逃离局部极小值的能力。

（4）玻尔兹曼机的发明是为了解决Hopfield神经网络的伪吸引子的问题，因此把退火算法、玻尔兹曼分布和Hopfield神经网络结合在一起形成了玻尔兹曼机（随机神经网络）。

10、受限玻尔兹曼机RBM

背景：上一节我们详细的探讨了玻尔兹曼机，玻尔兹曼机的发明是为了解决Hopfield神经网络的伪吸引子的问题，因此把退火算法、玻尔兹曼分布和Hopfield神经网络结合在一起形成了玻尔兹曼机（随机神经网络）。通过前面几节我们知道玻尔兹曼机可以很好的解决Hopfield神经网络的伪吸引子的问题，但是带来的另外一个大问题就是计算量太大了，训练周期长，因此Hinton和Sejnowski于1986年提出的一种生成式随机神经网络(generative stochastic neuralnetwork)即受限玻尔兹曼机，其实受限玻尔兹曼机是在玻尔兹曼机的基础上通过Gibbs采样，进而提升了计算速度。

但是想要搞明白Gibbs采样不是一件容易的事，他需要很深的背景知识，想要理解Gibbs采样就需要理解MCMC和Metropolis算法，想要理解MCMC就需要理解马尔科夫链，想要理解马尔科夫链就需要理解马尔科夫过程。

我打算从最初的马尔科夫过程继续深入讲解，因为这些知识不仅仅这里使用到，在强化学习、自然语言处理都是经常使用的，搞明白他们很有必要，尤其马尔科夫过程，整个强化学习就是基于马尔科夫为基础的，因此深入理解他很有必要，而隐马尔可夫又是自然语言处理经常使用的，因此深入理解他们很有必要，从这里也可以看出，知识点并不是孤立的，他们都是有联系的，讲的简单点就是方法论，他们都是相通，因此大家学习时就要学会举一反三，触类旁通，然而想达到这样的地步，你必须深入理解他们。

posted @ 2022-04-26 12:00 bH1pJ 阅读(94) 评论(0) 编辑收藏举报

刷新页面返回顶部

Hopfield网络和玻尔兹曼机对比，总结，以及受限玻尔兹曼机RBM的提出

公告