摘要: 在epoch超过阈值的前提下,$lrlossCoeffepoch$的值也超过一定的阈值,才能使得训练结束后模型收敛。 from tqdm import tqdm data1 = torch.nn.Parameter(torch.randn(3, 2048)) data2 = torch.ones(3 阅读全文
posted @ 2021-07-13 15:30 tensor_zhang 阅读(1113) 评论(0) 推荐(0) 编辑
摘要: 1,官网 https://gym.openai.com/docs/ 2,gym简介 Gym是一个用于开发和比较强化学习算法的工具包,是测试问题——环境(environment)的集合。这些环境具有共享接口,允许编写通用算法。 3,gym安装 pip安装 pip install gym 从源码构建(直 阅读全文
posted @ 2021-07-13 14:42 tensor_zhang 阅读(336) 评论(0) 推荐(0) 编辑