强化学习如何保存模型?

保存模的关键在于知道决定模型的东西是什么?框架和参数,有了框架保存参数,没有框架,全部保存。

模型保存

模型保存本质上是保存训练好的参数,便于重复利用模型,随时可以调用。

保存时要弄明白这个模型和方法的关键是什么?每一次使用时用的是什么东西?

把这些关键保存下来就是你想要的东西。

例如,强化学习中使用表格法记录,关键就是你训练出来的值函数;使用函数来近似值函数、策略函数,函数的性质就是关键,只需要保存神经网络的参数即可。

落实到实践中,例如使用pytorch搭建神经网络,可以查看pytorch的文档,有专门的函数存储模型参数。

参考链接

  1. 强化学习训练的模型怎么存储?比如OpenAI-gym训练好的模型? - Kun Ni的回答 - 知乎 https://www.zhihu.com/question/67825049/answer/256927745
posted @ 2022-12-26 17:26  芋圆院长  阅读(475)  评论(0编辑  收藏  举报