SOM 的两种算法

我参考了这篇文章

另一个很好的演示在这里

SOM

t是训练步
一个输入数据是n维向量
待训练的是一堆节点,这堆节点之间有边连着,通常是排成grid那样的网状结构
一个要训练的节点包含一个n维向量

训练从t=0开始,t=输入数据个数时结束
每步的更新规则是

其中a(t)是一个随训练步数衰减的函数,c,i都是训练节点的索引,c是离x(t)最近的节点的索引,hci是节点mc和mi的距离。也就是说每个训练步选一个输入数据x(t),将离它最近的节点mc向这个输入数据拉扯,这个节点又透过连着的边,带动邻近的节点向这个输入数据移动。

Batch SOM

这样输入数据太多的时候会很慢,改进的方法称为batch som。
方法是在每一步,对每个节点 mj,统计所有选中它为最近邻的输入数据的平均值,记为 
再按下式更新每个节点的值。

nj是选了mj做最邻近的输入数据个数,hji是节点mi与节点mj的边距离。可见对于节点mi,它会更新到邻近所有节点mj对应的的加权平均值。






posted @ 2017-02-24 00:42  dydx  阅读(2851)  评论(0编辑  收藏  举报