随笔档案「2021年7月13日」：网络训练过程中：学习率/lr、损失函数的系... - tensor_zhang

2021年7月13日

网络训练过程中：学习率/lr、损失函数的系数/lossCoeff、训练代数/epoch，与模型收敛之间的关系

摘要：在epoch超过阈值的前提下，$lrlossCoeffepoch$的值也超过一定的阈值，才能使得训练结束后模型收敛。 from tqdm import tqdm data1 = torch.nn.Parameter(torch.randn(3, 2048)) data2 = torch.ones(3 阅读全文

posted @ 2021-07-13 15:30 tensor_zhang 阅读(1234) 评论(0) 推荐(0)

pytorch2-gym

摘要： 1，官网 https://gym.openai.com/docs/ 2，gym简介 Gym是一个用于开发和比较强化学习算法的工具包，是测试问题——环境（environment）的集合。这些环境具有共享接口，允许编写通用算法。 3，gym安装 pip安装 pip install gym 从源码构建（直阅读全文

posted @ 2021-07-13 14:42 tensor_zhang 阅读(464) 评论(0) 推荐(0)

tensor_zhang

公告