Hopfield网络和玻尔兹曼机对比,总结,以及受限玻尔兹曼机RBM的提出
7、Hopfield网络
特点:
(1)是一个简单的单层全连接神经网络;
(2)每个神经元和其他神经元是全连接的关系;
(3)在更新网络权重时,有异步工作方式:每次只更新一个神经元的权重,其他权重保持不变;和同步工作方式:所有神经元同时调整状态;
(4)Loss function是什么?(能量函数),能量函数的定义来自于 李亚诺夫函数,用来刻画整个网络的能量状态,而且是个单调函数,这也是为什么Hopfield网络容易陷入到局部极小值的原因。
缺点:
(1)容易陷入局部最小值,得不到全局最优解;
8、随机网络(玻尔兹曼机)
特点:
(1)不是按照某种确定性的网络进行状态演化,而是按照某种概率分布决定其状态转移。因此有可能跳出局部极小值;
(2)什么是玻尔兹曼分布(吉布斯分布)?就是系统的状态概率分布。用来刻画系统在不同能量状态下的概率分布,在玻尔兹曼机中引入该分布的目的是:为了让网络能够逃离局部极小值;
(3)玻尔兹曼机中的神经元只有两种输出状态(0和1);
(4)玻尔兹曼机的网络结构,介于Hopfield网络(神经元全连接)和BP神经网路(3层)之间;
(5) BM网络采用了与DHNN网络相同的能量函数描述网络的状态:
Hopfield网络和玻尔兹曼机对比,总结:
(1)Hopfield网络和玻尔兹曼机,有着不同的网络结构,前者是全连接网络,后者包含了三层(输入层、隐含层和输出层和BP神经网络有相似之处)
(2)Hopfield网络和玻尔兹曼机,有着相同的能量函数:任何两个神经元的状态之积乘上权重,之和。再加上神经元状态和bias之积;
(3)Hopfield网络和玻尔兹曼机,的训练方法不同,前者是按照衡量函数的梯度走的,而能量函数是个单调函数,所以容易陷入到局部极小值,后者是按照概率走的,通过引入玻尔兹曼分布,使得神经元的权重在更新时有了概率,从而具备了逃离局部极小值的能力。
(4)玻尔兹曼机的发明是为了解决Hopfield神经网络的伪吸引子的问题,因此把退火算法、玻尔兹曼分布和Hopfield神经网络结合在一起形成了玻尔兹曼机(随机神经网络)。
10、受限玻尔兹曼机RBM
背景: 上一节我们详细的探讨了玻尔兹曼机,玻尔兹曼机的发明是为了解决Hopfield神经网络的伪吸引子的问题,因此把退火算法、玻尔兹曼分布和Hopfield神经网络结合在一起形成了玻尔兹曼机(随机神经网络)。通过前面几节我们知道玻尔兹曼机可以很好的解决Hopfield神经网络的伪吸引子的问题,但是带来的另外一个大问题就是计算量太大了,训练周期长,因此Hinton和Sejnowski于1986年提出的一种生成式随机神经网络(generative stochastic neuralnetwork)即受限玻尔兹曼机,其实受限玻尔兹曼机是在玻尔兹曼机的基础上通过Gibbs采样,进而提升了计算速度。
但是想要搞明白Gibbs采样不是一件容易的事,他需要很深的背景知识,想要理解Gibbs采样就需要理解MCMC和Metropolis算法,想要理解MCMC就需要理解马尔科夫链,想要理解马尔科夫链就需要理解马尔科夫过程。
我打算从最初的马尔科夫过程继续深入讲解,因为这些知识不仅仅这里使用到,在强化学习、自然语言处理都是经常使用的,搞明白他们很有必要,尤其马尔科夫过程,整个强化学习就是基于马尔科夫为基础的,因此深入理解他很有必要,而隐马尔可夫又是自然语言处理经常使用的,因此深入理解他们很有必要,从这里也可以看出,知识点并不是孤立的,他们都是有联系的,讲的简单点就是方法论,他们都是相通,因此大家学习时就要学会举一反三,触类旁通,然而想达到这样的地步,你必须深入理解他们。