上一页 1 2 3 4 5 6 ··· 11 下一页
摘要: 目录 Policy based方法 vs Value based方法 策略网络 算法总体流程 如何通过对回归任务的优化来更新Q网络 为什么不可以同时更新Q网络和目标网络 为什么要使用带有探索策略的Q函数 探索策略的数学表达 ReplayBuffer的作用 Q值被高估的问题 源码实现 参考资料 DQN 阅读全文
posted @ 2020-09-30 15:00 黎明程序员 阅读(1158) 评论(0) 推荐(1) 编辑
摘要: 目录 强化学习中的关键概念 游戏案例 策略网络 策略网络的训练 源码实现 效果演示 参考资料 本文不再维护,请移步最新博客: https://zhuanlan.zhihu.com/p/408239932 强化学习中的关键概念 智能体(Agent):也就是我们的机器人,它内部有一个策略网络,策略网络接 阅读全文
posted @ 2020-09-26 16:52 黎明程序员 阅读(869) 评论(0) 推荐(0) 编辑
摘要: 目录 回顾简单RNN的梯度消失问题 LSTM如何解决梯度消失 遗忘门对梯度消失的影响 遗忘门的初始化技巧 参考资料 回顾简单RNN的梯度消失问题 在简单RNN的前向传播过程中,输入的数据循环地与隐藏层里的权重W(都是很小的数)做乘法运算,那么损失函数对较长时间步前的W的梯度就会很小(因为W会累乘,激 阅读全文
posted @ 2020-07-16 00:22 黎明程序员 阅读(2157) 评论(0) 推荐(0) 编辑
摘要: 目录 LSTMs网络架构 LSTM的核心思想 遗忘门(Forget gate) 输入门(Input gate) 输出门(Output gate) LSTMs是如何解决长程依赖问题的? Peephole是啥 多层LSTM 参考资料 长短期记忆网络通常称为LSTMs,是一种特殊的RNN,能够学习长期依赖 阅读全文
posted @ 2020-07-14 23:47 黎明程序员 阅读(1773) 评论(0) 推荐(0) 编辑
摘要: 目录 长程依赖关系的解释 为什么传统RNN不能解决长程依赖问题 如何解决长程依赖问题 参考资料 长程依赖关系的解释 句子1:the clouds are in the (). 对语言模型而言,这里的()很容易就能被确定为sky,因为它刚“读过”的单词是“clouds are in the”,语言模型 阅读全文
posted @ 2020-07-13 23:01 黎明程序员 阅读(4472) 评论(0) 推荐(0) 编辑
摘要: 目录 梯度消失原因之一:激活函数 梯度消失原因之二:初始化权重 不同损失函数下RNN的梯度消失程度对比 实践中遇到梯度消失怎么办? 参考资料 在实践过程中,RNN的一个缺点是在训练的过程中容易梯度消失。 梯度消失原因之一:激活函数 sigmod的导函数峰值为0.25,由于反向传播的距离越长,连乘的小 阅读全文
posted @ 2020-07-11 19:49 黎明程序员 阅读(1265) 评论(0) 推荐(0) 编辑
摘要: 目录 随机初始化 使用预训练模型 参考资料 可以随机初始化、也可以使用预训练好的,这里我们分类讨论 随机初始化 从上图可以看到,pytorch的embedding可以是用一个正态分布随机初始化的 对应代码 from io import open import unicodedata import s 阅读全文
posted @ 2020-07-09 22:50 黎明程序员 阅读(2078) 评论(0) 推荐(1) 编辑
摘要: 目录 定义网络 梯度反向传播 梯度更新 面试时的变相问法 参考资料 BPTT(back-propagation through time)算法是常用的训练RNN的方法,其实本质还是BP算法,只不过RNN处理时间序列数据,所以要基于时间反向传播,故叫随时间反向传播。 BPTT算法在吴恩达和李宏毅等教授 阅读全文
posted @ 2020-07-09 21:41 黎明程序员 阅读(1616) 评论(1) 推荐(0) 编辑
摘要: 目录 单层神经网络 RNN原理 经典RNN结构 N VS 1 RNN结构 1 VS N RNN结构 Pytorch文本分类实践 参考资料 RNN 的英文全称是 Recurrent Neural Networks ,即循环神经网络,他是一种对序列型数据进行建模的深度模型。在学习之前,先来复习基本的单层 阅读全文
posted @ 2020-07-04 23:18 黎明程序员 阅读(2202) 评论(0) 推荐(0) 编辑
摘要: 目录 github地址 内容介绍readme 参考资料 PyTorch是一个简单易用的深度学习框架。 本文主要复现了PyTorch官网的一些常用demo,并修改demo,提供了一系列能方便移植到自己的图像分类任务并高效实用的解决方案。 github地址 https://github.com/itmo 阅读全文
posted @ 2020-07-02 23:19 黎明程序员 阅读(317) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 11 下一页