2018 年 12月 4 日随笔档案 - 大来

2018年12月4日

摘要： 1.基本理论双向 RNN 结合时间上从序列起点开始移动的 RNN 和另一个时间上从序列末尾开始移动的 RNN 2.逻辑图其中 h (t) 代表通过时间向前移动的子 RNN 的状态，g (t) 代表通过时间向后移动的子 RNN 的状态允许输出单元 o (t) 能够计算同时依赖于过去和未来且对时刻阅读全文

posted @ 2018-12-04 17:05 大来阅读(1555) 评论(0) 推荐(0) 编辑

循环神经网络

摘要： 1.用于处理序列数据的神经网络 s (t) = f(s (t−1) ;θ) 2.循环神经网络阅读全文

posted @ 2018-12-04 15:22 大来阅读(112) 评论(0) 推荐(0) 编辑

卷积网络

摘要： 1.卷积运算卷积的第一个参数（在这个例子中，函数 x）通常叫做输入（input），第二个参数（函数 w）叫做核函数（kernel function）。输出有时被称作特征映射（feature map） 2.动机卷积运算通过三个重要的思想来帮助改进机器学习系统：稀疏交互（sparseintera 阅读全文

posted @ 2018-12-04 15:07 大来阅读(229) 评论(0) 推荐(0) 编辑

深度模型中的优化

摘要： 1.随机梯度下降保证SGD收敛的一个充分条件是线性衰减学习率直到第 τ 次迭代：其中 α =k/τ 。在 τ 步迭代之后，一般使 ϵ 保持常数通常 τ 被设为需要反复遍历训练集几百次的迭代次数。通常 ϵ τ 应设为大约 ϵ 0 的 1%。主要问题是如何设置 ϵ 0 。若 ϵ 0 太大，学习曲阅读全文

posted @ 2018-12-04 09:01 大来阅读(493) 评论(0) 推荐(0) 编辑

大来

公告