Using Fast Weights to Attend to the Recent Past
Ba, Jimmy, et al. "Using Fast Weights to Attend to the Recent Past." Advances In Neural Information Processing Systems. 2016.
感觉就是引入了memory的机制,多了一个矩阵A,用来储存一定的信息。矩阵A在每次输入新的训练数据的时候会发生一定的变化。在两次数据输入期间,memory并不会变化,但是神经网络的隐藏输出会不断迭代变化。感觉这和人晚上睡觉一样,没有接受新的输入,但是大脑依然是活跃的,比如做梦。感觉像是一种时序的Attention机制,因为最后一个公式就好像是把以前所有的隐藏状态按照时间衰减和一定的attention进行了融合。该工作仍然值得深入分析。
有两个repo实现了这个算法:https://github.com/ajarai/fast-weights 和 https://github.com/jiamings/fast-weights
黄世宇/Shiyu Huang's Personal Page:https://huangshiyu13.github.io/
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步