SOM 的两种算法
我参考了这篇文章
另一个很好的演示在这里
SOM
t是训练步
一个输入数据是n维向量
待训练的是一堆节点,这堆节点之间有边连着,通常是排成grid那样的网状结构
一个要训练的节点包含一个n维向量
训练从t=0开始,t=输入数据个数时结束
每步的更新规则是
其中a(t)是一个随训练步数衰减的函数,c,i都是训练节点的索引,c是离x(t)最近的节点的索引,hci是节点mc和mi的边距离。也就是说每个训练步选一个输入数据x(t),将离它最近的节点mc向这个输入数据拉扯,这个节点又透过连着的边,带动邻近的节点向这个输入数据移动。
Batch SOM
这样输入数据太多的时候会很慢,改进的方法称为batch som。
方法是在每一步,对每个节点 mj,统计所有选中它为最近邻的输入数据的平均值,记为 。
再按下式更新每个节点的值。
nj是选了mj做最邻近的输入数据个数,hji是节点mi与节点mj的边距离。可见对于节点mi,它会更新到邻近所有节点mj对应的的加权平均值。